Rosette para monitoramento de mídia social · 2017-08-22 · idiomas a partir de fontes como o...

2
Rosette para monitoramento de mídia social SOLUÇÕES Analise mídias sociais em mais de quarenta idiomas As mídias sociais são constantemente criadas e consumidas no idioma nativo dos usuários. Os aplicativos que processam conteúdo de mídia social precisam ser compatíveis com esses idiomas. Em 2010, só metade de todos os tuítes foram em inglês e, em 2011, mais de 75% dos usuários de Facebook eram de fora dos Estados Unidos. A plataforma de linguística Rosette® permite a análise de dados em mais de quarenta idiomas a partir de fontes como o Facebook, o LinkedIn, o Twitter e outros canais de mídia social. “A Basis Technology nos permite expandir rapidamente a abrangência de nossa análise nos idiomas de procura pelos nossos clientes. Escolhemos o Rosette porque sua precisão e seu desempenho nos permite expandir a cobertura global de nossa tecnologia para absorver as ideias de conversas em mídias sociais em outros idiomas.” Steve Winters, vice-presidente de engenharia da NetBase Solutions PRINCIPAIS BENEFÍCIOS O Rosette oferece um acesso conveniente a recursos essenciais de linguística necessários para implementar um monitoramento de mídia social multilíngue, dentre eles: Identificação de idiomas — a primeira etapa na preparação de mídia social para análise é identificar o idioma. O Rosette oferece uma detecção com alto nível de resultados para 55 idiomas. Análise linguística — o Rosette oferece uma análise linguística profunda, inclusive marcação de categorias gramaticais, lematização (localização das formas dicionarizadas das palavras), detecção de limites entre sentenças e extração de sintagmas nominais. As tecnologias de sentimento e semântica usam esses resultados para rapidamente adicionar novos idiomas. Extração de entidades para filtragem de dados — os aplicativos de mídia social podem filtrar com base em metadados derivados de conteúdo, tais como entidades. O Rosette localiza 18 tipos de entidades (pessoas, lugares, empresas etc.) em mais de doze idiomas. Os desenvolvedores também podem personalizar o Rosette para reconhecer outros tipos de entidade. Extração de entidades para análise de sentimento — o Rosette permite que sistemas de análise de semântica e sentimento localizem entidades para mais processamento. Agrupamento de mensagens — organiza resultados de busca para uma análise rápida, agrupando conversações semelhantes ou quase duplicadas. A plataforma de linguística Rosette permite que aplicativos de monitoramento de mídia social identifiquem o idioma dos feeds de entrada, analisem texto, extraiam entidades e melhorem resultados de busca. Coletar Analisar Índice Entregar • Mídia social • Blogues • Twitter • Notícias • Resenhas de produto Enriqueça e prepare conteúdo de mídia social com metadados Ative buscas por palavra-chave com análise linguística. Busque nomes com correspondência difusa. Ofereça acesso instantâneo a dados de mídia social e análise a profissionais de marketing Identificação de idiomas Agrupamento de documentos Extração de entidade Análise de sentimento Geração de relatórios e análise Monitoramento de marca, produto e entidade Painéis Busca avançada e navegação facetadas Busca por palavra-chave Busca de nomes

Transcript of Rosette para monitoramento de mídia social · 2017-08-22 · idiomas a partir de fontes como o...

Page 1: Rosette para monitoramento de mídia social · 2017-08-22 · idiomas a partir de fontes como o Facebook, o LinkedIn, o Twitter e outros canais de mídia social. “A Basis Technology

Rosette para monitoramento de mídia social

SOLUÇÕES

Analise mídias sociaisem mais de quarentaidiomasAs mídias sociais são constantemente criadas e consumidasno idioma nativo dos usuários. Os aplicativos que processamconteúdo de mídia social precisam ser compatíveis comesses idiomas. Em 2010, só metade de todos os tuítes foramem inglês e, em 2011, mais de 75% dos usuários de Facebookeram de fora dos Estados Unidos. A plataforma de linguísticaRosette® permite a análise de dados em mais de quarentaidiomas a partir de fontes como o Facebook, o LinkedIn, oTwitter e outros canais de mídia social.

“A Basis Technology nos permite expandir rapidamente aabrangência de nossa análise nos idiomas de procura pelosnossos clientes. Escolhemos o Rosette porque sua precisão e seudesempenho nos permite expandir a cobertura global de nossatecnologia para absorver as ideias de conversas em mídias sociaisem outros idiomas.”

— Steve Winters, vice-presidente de engenharia da NetBaseSolutions

PRINCIPAIS BENEFÍCIOSO Rosette oferece um acesso conveniente a recursosessenciais de linguística necessários para implementar ummonitoramento de mídia social multilíngue, dentre eles:

• Identificação de idiomas — a primeira etapa napreparação de mídia social para análise é identificar oidioma. O Rosette oferece uma detecção com alto nívelde resultados para 55 idiomas.

• Análise linguística — o Rosette oferece uma análiselinguística profunda, inclusive marcação de categoriasgramaticais, lematização (localização das formasdicionarizadas das palavras), detecção de limitesentre sentenças e extração de sintagmas nominais.As tecnologias de sentimento e semântica usam essesresultados para rapidamente adicionar novos idiomas.

• Extração de entidades para filtragem de dados — osaplicativos de mídia social podem filtrar com base emmetadados derivados de conteúdo, tais como entidades.O Rosette localiza 18 tipos de entidades (pessoas,lugares, empresas etc.) em mais de doze idiomas. Osdesenvolvedores também podem personalizar o Rosettepara reconhecer outros tipos de entidade.

• Extração de entidades para análise de sentimento— o Rosette permite que sistemas de análise desemântica e sentimento localizem entidades para maisprocessamento.

• Agrupamento de mensagens — organiza resultados debusca para uma análise rápida, agrupando conversaçõessemelhantes ou quase duplicadas.

A plataforma de linguística Rosette permite que aplicativos demonitoramento de mídia social identifiquem o idioma dos feeds deentrada, analisem texto, extraiam entidades e melhorem resultadosde busca.

Coletar

Analisar

Índice

Entregar

• Mídia social• Blogues• Twitter• Notícias• Resenhas de produto

Enriqueça e prepare conteúdo de mídia social com metadados

Ative buscas porpalavra-chave com análise linguística. Busque nomescom correspondênciadifusa.

Ofereça acessoinstantâneo a dados demídia social e análise aprofissionais demarketing

Identificaçãode idiomas

Agrupamentode documentos

Extração deentidade

Análise desentimento

Geração de relatóriose análise

Monitoramento de marca,produto e entidade

Painéis

Busca avançada enavegação facetadas

Busca por palavra-chave

Busca de nomes

Page 2: Rosette para monitoramento de mídia social · 2017-08-22 · idiomas a partir de fontes como o Facebook, o LinkedIn, o Twitter e outros canais de mídia social. “A Basis Technology

ACESSE www.basistech.com ESCREVA-NOS [email protected] LIGUE +1-617-386-2090

One Alewife CenterCambridge, MA 02140

2553 Dulles View DriveHerndon, VA 20171

1 Furzeground WayMiddlesex UB11 1BD, UK

9-6 Nibancho, Chiyoda-kuTokyo 102-0084, Japan

© 2013 Basis Technology Corporaon. “Basis Technology”, “Geoscope”, “Odyssey Digital Forensics”, “Rosee”, and “We put the World in the World Wide Web” are registeredtrademarks of Basis Technology Corporaon. All other trademarks, service marks, and logos used in this document are the property of their respecve owners. (2013-06-21)

AGREGAÇÃO DE CONTEÚDO DE MÍDIASSOCIAISO Rosette desempenha uma função essencial no pré-processamento de mídias sociais em muitos idiomas.

• Identifique o idioma da mídia social — as configuraçõescom base em local e idioma especificado pelo usuáriopara publicações podem não ser confiáveis. O Rosetteidentifica o idioma com alta precisão.

• Localize nomes, marcas e empresas — o Rosettelocaliza entidades em cada publicação para criarmetadados, permitindo uma filtragem e uma buscarápidas de pessoas, lugares, nomes de empresa e outrasentidades.

• Melhore a busca por palavras-chave — os analisadoresde linguística Rosette produzem o lema (formadicionarizada) de cada palavra para aumentar onúmero de resultados de busca relevantes. Os métodosmais antigos, como a identificação de radicais,frequentemente produz resultados irrelevantes.

ANÁLISE DE MARCA E DE SENTIMENTOAlgumas tecnologias de análise de sentimento e de marcaapresentam análises linguísticas avançadas para o inglês,mas e para o alemão, o japonês, o português ou o espanhol?O Rosette Base Linguistics (Linguística de Base Rosette)oferece os elementos essenciais para muitas abordagens deanálise de sentimento em mais de 40 idiomas:

• Marcação de categoria gramatical• Lematização de palavras• Detecções de limites entre sentenças• Extração de sintagmas nominais

O Rosette Entity Extractor (Extrator de Entidade Rosette)leva a análise um passo além, localizando entidades —como pessoas, lugares, organizações ou produtos — quepodem ser usadas por algoritmos de análises de sentimentopara designar sentimento às entidades em vez de atribuirum sentimento generalizado em nível de mensagem oudocumento.

IDIOMAS COMPATÍVEISAlbanêsAlemãoÁrabeBúlgaroCatalãoChinês simplificadoChinês tradicionalCoreanoCroataDinamarquêsEslovacoEslovenoEspanholEstoniano

FinlandêsFrancêsGregoHebraicoHolandêsHúngaroIndonésioInglêsItalianoJaponêsLetãoMalaioNorueguêsPachto

PersaPolonêsPortuguêsRomenoRussoSérvioSuecoTailandêsTchecoTurcoUcranianoUrdu

RESOLVER VARIAÇÕES DE NOMESAs publicações em mídias sociais frequentemente contêmnomes e apelidos com erros de ortografia. O RosetteName Indexer (Indexador de Nome Rosette) aumenta abusca para localizar todas as referências a um nome emtodos os idiomas ou variações de grafia. Uma análisede reputação global da Madonna estará incompleta amenos que as publicações relevantes que grafam seunome como “マドンナ,” “Madonna Ciccone” ou “Madona”também sejam examinadas. O Rosette manipula apelidos,componentes de nomes ausentes, erros e variantes degrafia, nomes desordenados, o mesmo nome escrito emidiomas diferentes e muito mais. Para saber mais sobre osrecursos de correspondência de nomes do Rosette, acessewww.basistech.com/name-indexer.

MÍDIA SOCIAL EM NÚMEROS

• 24,1 milhões de usuários do Facebook na Turquia• 20,5 milhões de usuários do Facebook na França• 18,2 milhões de usuários do Facebook no México• 19,1% dos tuítes são em japonês• 9,6% dos tuítes são em português

Todos esses números são de 2010.

DECIFRE A MÍDIA SOCIAL EM ÁRABEAs conversas on-line em árabe apresentam um desafioespecial porque muitos interlocutores árabes usamcaracteres e números latinos em vez do sistema deescrita tradicional. Sem ser regido por regras formais,o sistema que usa os caracteres latinos pode ser usadointercambiavelmente por um caractere árabe e vice-versa.

QasimGasim8asim

2ulluhom

2illun

Gullhom

O alfabeto do bate-papo em árabe também varia de acordocom o dialeto do interlocutor. A expressão “diga-lhes” podeser escrita como “2ulluhom” por um egípcio, “2illun” por umlibanês ou “Gullhom” no dialeto do Golfo.

Os mecanismos de busca convencionais e analisadoreslinguísticos não conseguem decifrar o alfabeto de bate-papoem árabe. O Rosette abre acesso a esses dados porque:

• Detecta conversas de bate-papo em árabe

• Converte o alfabeto de bate-papo para o árabe nativo

• Encontra nomes pessoais e faz correspondências dessesnomes em várias grafias.