O Big Data pode predizer o próximo bestseller?

O Big Data pode predizer o próximo bestseller?
Author

Kashyap Dalal

Last updated August 30, 2017


  • 550 Views

Cada setor começou a canalizar o poder do Big Data - seja música, esportes ou indústria de TI.

E a indústria editorial não pode ficar para trás. Como a indústria da música, a publicação também depende de grandes sucessos.

Mas prever best-sellers não é fácil. Continua sendo uma arte enigmática que ninguém, a não ser os mais críticos e editores, pode acertar - a província do instinto e de suposições educadas.

Você sabia

Há momentos em que essas faculdades servem bem a indústria, mas quando se trata de autores iniciantes, a maioria invariavelmente erra.

Como você combate esse problema?

Se tivéssemos um algoritmo de computador capaz de identificar textos best-sellers com pelo menos 80% de sucesso…

Ah, mas nós fazemos! Bestseller-o-meter, tema de um próximo volume O Código de Bestseller: Anatomia do Romance de Sucesso , de Jodie Archer, uma ex-líder de pesquisa sobre literatura na Apple e Matthew l. Jockers, professor associado de inglês na Universidade de Nebraska-Lincoln. O resultado alegado do algoritmo é baseado no histórico de previsão dos best-sellers do New York Times que são aplicados retrospectivamente aos romances nos últimos 30 anos.

O funcionamento - Como esse algoritmo funciona?

O bestseller-ometer representa a tentativa de identificar características de ficção best-seller em escala, o que pode ser feito através da interrogação de um enorme corpo de literatura - dizem mais de 20.000 romances. Este projeto fornece uma verificação orientada a dados para receber sabedoria sobre os segredos por trás da ficção best-seller. Isso, no entanto, também vem com o medo de que, no possível No futuro, os editores podem apenas recorrer a essa tecnologia para ajudá-los a superar os métodos tradicionais de escolher um possível best-seller.

O alvorecer de uma ideia - mas foi mesmo?

O algoritmo que foi posteriormente construído por Jockers e Archer não é a primeira tentativa de aplicar o poder do Big Data aos livros. Uma startup de Berlim, a Inkitt, que estava por trás do que é chamado de "primeiro romance selecionado por um algoritmo", rastreia intensamente as respostas do leitor às matérias postadas em sua plataforma web para identificar possíveis best-sellers.

Fundado em 2011, o Jellybooks de Londres mede o engajamento do leitor no ciclo de produção literária antes de os livros serem publicados usando um software que é baixado pelos leitores em troca de acesso antecipado a um título.

No entanto, como o bestseller-ometer se distingue é unindo a erudição literária à potência computacional. O Código Bestseller documenta as considerações extremas que foram feitas no treinamento da máquina para ler e descompactar as microdecisões no nível da dicção e da sintaxe envolvidas na elaboração da ficção mais vendida.

Os algoritmos refletem escolhas analíticas e interpretativas que estão envolvidas na leitura de um livro de perto. Recursos como repetições, padrão de uso de palavras, alusões e ênfases temáticas são procurados.

Você sabia

Os elementos - O que o algoritmo usa

Alguns elementos comuns que o algoritmo usa são "voz" autoritária; verbos sobressalentes, francos, muitas vezes coloquiais, em prosa e declarativos que conotam caracteres de encargo voltados para a ação.

Os outros elementos menos comuns são algo chamado de "coesão" narrativa que Archer e Jockers descobriram. Coesão narrativa é um hábito que é frequentemente usado por autores best-sellers. Por exemplo, John Grisham geralmente dedica um terço desses romances à assinatura do tópico - lei e advogados.

O segredo do best-seller - de acordo com bestseller-ometer

Houve também descobertas confusas - como o sexo geralmente não vende. Na verdade, é um distintamente impopular entre o público e geralmente está confinado a uma pequena porção do material mais vendido.

Tomemos por exemplo Cinquenta Tons de Cinza - o livro estava repleto de pesadas cenas eróticas e uma reviravolta na trama. Portanto, este livro idealmente não deveria ter se tornado um best-seller.

No entanto, Jockers e Archer descobriram que o principal tema e assunto do livro era a proximidade humana - algo que é mais prevalente em todos os best-sellers. Fifty Shades girava principalmente em torno da idéia de intimidade emocional entre os personagens, o que o levou a se tornar um best-seller.

A desvantagem

Com os autores de best-sellers como JK Rowling e John Grisham já no palco, os editores costumam estar menos inclinados a desviar seus fundos para autores desconhecidos. É nesse ponto que o bestseller-ometer entrará em cena. No entanto, a maior preocupação com esse algoritmo será que os escritores podem agora escrever suas peças para satisfazer as necessidades do algoritmo sem qualquer pedigree literário.

A situação pode ir de um jeito ou de outro - um bom livro que merece obter o título de best-seller ou um livro ruim que satisfaça as necessidades do algoritmo, mas não o da literatura.

Conclusão

Como eu disse anteriormente, o big data está dominando todos os aspectos do mundo . Com maior uso, vem maior demanda - em qualquer setor pela aparência do mesmo.

A vida em big data é sempre uma aventura. Trabalhar com dados, detectar problemas, encontrar soluções e prever o futuro vem com o trabalho. Se você achar essa indústria intrigante e acreditar que esse é o lugar certo para você, faça uma certificação em big data e comece sua jornada neste mundo de aventuras.

About the Author

Kashyap drives the business growth strategy at Simplilearn and its execution through product innovation, product marketing, and brand building.

Recommended articles for you

Spark vs Hadoop - All You Need To Know

Article

Everything You Need to Know for a Hadoop Developer Interview

Article

How to become a Big Data Hadoop Architect - Learning Paths E...

Article

{{detail.h1_tag}}

{{detail.display_name}}
{{author.author_name}} {{author.author_name}}

{{author.author_name}}

{{detail.full_name}}

Published on {{detail.created_at| date}} {{detail.duration}}

  • {{detail.date}}
  • Views {{detail.downloads}}
  • {{detail.time}} {{detail.time_zone_code}}

Registrants:{{detail.downloads}}

Downloaded:{{detail.downloads}}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'On-Demand Webinar'}}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Webinar'}}

Hosted By

Profile

{{author.author_name}}

{{author.author_name}}

{{author.about_author}}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook' }}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook' }}

View {{detail.about_title && detail.about_title != null ? detail.about_title : 'On-Demand Webinar'}}

Webcast

Register Now!

Download the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook'}}!

First Name*
Last Name*
Email*
Company*
Phone Number*

View {{detail.about_title && detail.about_title != null ? detail.about_title : 'On-Demand Webinar'}}

Webcast

Register Now!

{{detail.about_title && detail.about_title != null ? detail.about_title : 'Webinar'}} Expired

Download the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook'}}

Email
{{ queryPhoneCode }}
Phone Number

Show full article video

Name Date Place
{{classRoomData.Date}} {{classRoomData.Place}} View Details

About the Author

{{detail.author_biography}}

About the Author

{{author.about_author}}

Recommended articles for you

{{ article.title }}

Article