O Big Data pode predizer o próximo bestseller?

O Big Data pode predizer o próximo bestseller?
Author

Kashyap Dalal

Last updated August 30, 2017


  • 550 Views

Cada setor começou a canalizar o poder do Big Data - seja música, esportes ou indústria de TI.

E a indústria editorial não pode ficar para trás. Como a indústria da música, a publicação também depende de grandes sucessos.

Mas prever best-sellers não é fácil. Continua sendo uma arte enigmática que ninguém, a não ser os mais críticos e editores, pode acertar - a província do instinto e de suposições educadas.

Você sabia

Há momentos em que essas faculdades servem bem a indústria, mas quando se trata de autores iniciantes, a maioria invariavelmente erra.

Como você combate esse problema?

Se tivéssemos um algoritmo de computador capaz de identificar textos best-sellers com pelo menos 80% de sucesso…

Ah, mas nós fazemos! Bestseller-o-meter, tema de um próximo volume O Código de Bestseller: Anatomia do Romance de Sucesso , de Jodie Archer, uma ex-líder de pesquisa sobre literatura na Apple e Matthew l. Jockers, professor associado de inglês na Universidade de Nebraska-Lincoln. O resultado alegado do algoritmo é baseado no histórico de previsão dos best-sellers do New York Times que são aplicados retrospectivamente aos romances nos últimos 30 anos.

O funcionamento - Como esse algoritmo funciona?

O bestseller-ometer representa a tentativa de identificar características de ficção best-seller em escala, o que pode ser feito através da interrogação de um enorme corpo de literatura - dizem mais de 20.000 romances. Este projeto fornece uma verificação orientada a dados para receber sabedoria sobre os segredos por trás da ficção best-seller. Isso, no entanto, também vem com o medo de que, no possível No futuro, os editores podem apenas recorrer a essa tecnologia para ajudá-los a superar os métodos tradicionais de escolher um possível best-seller.

O alvorecer de uma ideia - mas foi mesmo?

O algoritmo que foi posteriormente construído por Jockers e Archer não é a primeira tentativa de aplicar o poder do Big Data aos livros. Uma startup de Berlim, a Inkitt, que estava por trás do que é chamado de "primeiro romance selecionado por um algoritmo", rastreia intensamente as respostas do leitor às matérias postadas em sua plataforma web para identificar possíveis best-sellers.

Fundado em 2011, o Jellybooks de Londres mede o engajamento do leitor no ciclo de produção literária antes de os livros serem publicados usando um software que é baixado pelos leitores em troca de acesso antecipado a um título.

No entanto, como o bestseller-ometer se distingue é unindo a erudição literária à potência computacional. O Código Bestseller documenta as considerações extremas que foram feitas no treinamento da máquina para ler e descompactar as microdecisões no nível da dicção e da sintaxe envolvidas na elaboração da ficção mais vendida.

Os algoritmos refletem escolhas analíticas e interpretativas que estão envolvidas na leitura de um livro de perto. Recursos como repetições, padrão de uso de palavras, alusões e ênfases temáticas são procurados.

Você sabia

Os elementos - O que o algoritmo usa

Alguns elementos comuns que o algoritmo usa são "voz" autoritária; verbos sobressalentes, francos, muitas vezes coloquiais, em prosa e declarativos que conotam caracteres de encargo voltados para a ação.

Os outros elementos menos comuns são algo chamado de "coesão" narrativa que Archer e Jockers descobriram. Coesão narrativa é um hábito que é frequentemente usado por autores best-sellers. Por exemplo, John Grisham geralmente dedica um terço desses romances à assinatura do tópico - lei e advogados.

O segredo do best-seller - de acordo com bestseller-ometer

Houve também descobertas confusas - como o sexo geralmente não vende. Na verdade, é um distintamente impopular entre o público e geralmente está confinado a uma pequena porção do material mais vendido.

Tomemos por exemplo Cinquenta Tons de Cinza - o livro estava repleto de pesadas cenas eróticas e uma reviravolta na trama. Portanto, este livro idealmente não deveria ter se tornado um best-seller.

No entanto, Jockers e Archer descobriram que o principal tema e assunto do livro era a proximidade humana - algo que é mais prevalente em todos os best-sellers. Fifty Shades girava principalmente em torno da idéia de intimidade emocional entre os personagens, o que o levou a se tornar um best-seller.

A desvantagem

Com os autores de best-sellers como JK Rowling e John Grisham já no palco, os editores costumam estar menos inclinados a desviar seus fundos para autores desconhecidos. É nesse ponto que o bestseller-ometer entrará em cena. No entanto, a maior preocupação com esse algoritmo será que os escritores podem agora escrever suas peças para satisfazer as necessidades do algoritmo sem qualquer pedigree literário.

A situação pode ir de um jeito ou de outro - um bom livro que merece obter o título de best-seller ou um livro ruim que satisfaça as necessidades do algoritmo, mas não o da literatura.

Conclusão

Como eu disse anteriormente, o big data está dominando todos os aspectos do mundo . Com maior uso, vem maior demanda - em qualquer setor pela aparência do mesmo.

A vida em big data é sempre uma aventura. Trabalhar com dados, detectar problemas, encontrar soluções e prever o futuro vem com o trabalho. Se você achar essa indústria intrigante e acreditar que esse é o lugar certo para você, faça uma certificação em big data e comece sua jornada neste mundo de aventuras.

Find our Big Data Hadoop and Spark Developer Online Classroom training classes in top cities:

Name Date Place
Big Data Hadoop and Spark Developer 29 Sep -4 Nov 2018, Weekend batch Your City View Details
Big Data Hadoop and Spark Developer 6 Oct -11 Nov 2018, Weekend batch Your City View Details
Big Data Hadoop and Spark Developer 14 Oct -4 Nov 2018, Weekdays batch Your City View Details

About the Author

Kashyap drives the business growth strategy at Simplilearn and its execution through product innovation, product marketing, and brand building.


{{detail.h1_tag}}

{{detail.display_name}}
{{author.author_name}} {{author.author_name}}

{{author.author_name}}

{{detail.full_name}}

Published on {{detail.created_at| date}} {{detail.duration}}

  • {{detail.date}}
  • Views {{detail.downloads}}
  • {{detail.time}} {{detail.time_zone_code}}

Registrants:{{detail.downloads}}

Downloaded:{{detail.downloads}}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'On-Demand Webinar'}}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Webinar'}}

Hosted By

Profile

{{author.author_name}}

{{author.author_name}}

{{author.about_author}}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook' }}

About the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook' }}

View {{detail.about_title && detail.about_title != null ? detail.about_title : 'On-Demand Webinar'}}

Webcast

Register Now!

Download the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook'}}!

First Name*
Last Name*
Email*
Company*
Phone Number*

View {{detail.about_title && detail.about_title != null ? detail.about_title : 'On-Demand Webinar'}}

Webcast

Register Now!

{{detail.about_title && detail.about_title != null ? detail.about_title : 'Webinar'}} Expired

Download the {{detail.about_title && detail.about_title != null ? detail.about_title : 'Ebook'}}

Email
{{ queryPhoneCode }}
Phone Number

Show full article video

Name Date Place
{{classRoomData.Date}} {{classRoomData.Place}} View Details

About the Author

{{detail.author_biography}}

About the Author

{{author.about_author}}