Rosette para monitoramento de mídia social · 2017-08-22 · idiomas a partir de fontes como o...

Post on 28-May-2020

1 views 0 download

Transcript of Rosette para monitoramento de mídia social · 2017-08-22 · idiomas a partir de fontes como o...

Rosette para monitoramento de mídia social

SOLUÇÕES

Analise mídias sociaisem mais de quarentaidiomasAs mídias sociais são constantemente criadas e consumidasno idioma nativo dos usuários. Os aplicativos que processamconteúdo de mídia social precisam ser compatíveis comesses idiomas. Em 2010, só metade de todos os tuítes foramem inglês e, em 2011, mais de 75% dos usuários de Facebookeram de fora dos Estados Unidos. A plataforma de linguísticaRosette® permite a análise de dados em mais de quarentaidiomas a partir de fontes como o Facebook, o LinkedIn, oTwitter e outros canais de mídia social.

“A Basis Technology nos permite expandir rapidamente aabrangência de nossa análise nos idiomas de procura pelosnossos clientes. Escolhemos o Rosette porque sua precisão e seudesempenho nos permite expandir a cobertura global de nossatecnologia para absorver as ideias de conversas em mídias sociaisem outros idiomas.”

— Steve Winters, vice-presidente de engenharia da NetBaseSolutions

PRINCIPAIS BENEFÍCIOSO Rosette oferece um acesso conveniente a recursosessenciais de linguística necessários para implementar ummonitoramento de mídia social multilíngue, dentre eles:

• Identificação de idiomas — a primeira etapa napreparação de mídia social para análise é identificar oidioma. O Rosette oferece uma detecção com alto nívelde resultados para 55 idiomas.

• Análise linguística — o Rosette oferece uma análiselinguística profunda, inclusive marcação de categoriasgramaticais, lematização (localização das formasdicionarizadas das palavras), detecção de limitesentre sentenças e extração de sintagmas nominais.As tecnologias de sentimento e semântica usam essesresultados para rapidamente adicionar novos idiomas.

• Extração de entidades para filtragem de dados — osaplicativos de mídia social podem filtrar com base emmetadados derivados de conteúdo, tais como entidades.O Rosette localiza 18 tipos de entidades (pessoas,lugares, empresas etc.) em mais de doze idiomas. Osdesenvolvedores também podem personalizar o Rosettepara reconhecer outros tipos de entidade.

• Extração de entidades para análise de sentimento— o Rosette permite que sistemas de análise desemântica e sentimento localizem entidades para maisprocessamento.

• Agrupamento de mensagens — organiza resultados debusca para uma análise rápida, agrupando conversaçõessemelhantes ou quase duplicadas.

A plataforma de linguística Rosette permite que aplicativos demonitoramento de mídia social identifiquem o idioma dos feeds deentrada, analisem texto, extraiam entidades e melhorem resultadosde busca.

Coletar

Analisar

Índice

Entregar

• Mídia social• Blogues• Twitter• Notícias• Resenhas de produto

Enriqueça e prepare conteúdo de mídia social com metadados

Ative buscas porpalavra-chave com análise linguística. Busque nomescom correspondênciadifusa.

Ofereça acessoinstantâneo a dados demídia social e análise aprofissionais demarketing

Identificaçãode idiomas

Agrupamentode documentos

Extração deentidade

Análise desentimento

Geração de relatóriose análise

Monitoramento de marca,produto e entidade

Painéis

Busca avançada enavegação facetadas

Busca por palavra-chave

Busca de nomes

ACESSE www.basistech.com ESCREVA-NOS info@basistech.com LIGUE +1-617-386-2090

One Alewife CenterCambridge, MA 02140

2553 Dulles View DriveHerndon, VA 20171

1 Furzeground WayMiddlesex UB11 1BD, UK

9-6 Nibancho, Chiyoda-kuTokyo 102-0084, Japan

© 2013 Basis Technology Corporaon. “Basis Technology”, “Geoscope”, “Odyssey Digital Forensics”, “Rosee”, and “We put the World in the World Wide Web” are registeredtrademarks of Basis Technology Corporaon. All other trademarks, service marks, and logos used in this document are the property of their respecve owners. (2013-06-21)

AGREGAÇÃO DE CONTEÚDO DE MÍDIASSOCIAISO Rosette desempenha uma função essencial no pré-processamento de mídias sociais em muitos idiomas.

• Identifique o idioma da mídia social — as configuraçõescom base em local e idioma especificado pelo usuáriopara publicações podem não ser confiáveis. O Rosetteidentifica o idioma com alta precisão.

• Localize nomes, marcas e empresas — o Rosettelocaliza entidades em cada publicação para criarmetadados, permitindo uma filtragem e uma buscarápidas de pessoas, lugares, nomes de empresa e outrasentidades.

• Melhore a busca por palavras-chave — os analisadoresde linguística Rosette produzem o lema (formadicionarizada) de cada palavra para aumentar onúmero de resultados de busca relevantes. Os métodosmais antigos, como a identificação de radicais,frequentemente produz resultados irrelevantes.

ANÁLISE DE MARCA E DE SENTIMENTOAlgumas tecnologias de análise de sentimento e de marcaapresentam análises linguísticas avançadas para o inglês,mas e para o alemão, o japonês, o português ou o espanhol?O Rosette Base Linguistics (Linguística de Base Rosette)oferece os elementos essenciais para muitas abordagens deanálise de sentimento em mais de 40 idiomas:

• Marcação de categoria gramatical• Lematização de palavras• Detecções de limites entre sentenças• Extração de sintagmas nominais

O Rosette Entity Extractor (Extrator de Entidade Rosette)leva a análise um passo além, localizando entidades —como pessoas, lugares, organizações ou produtos — quepodem ser usadas por algoritmos de análises de sentimentopara designar sentimento às entidades em vez de atribuirum sentimento generalizado em nível de mensagem oudocumento.

IDIOMAS COMPATÍVEISAlbanêsAlemãoÁrabeBúlgaroCatalãoChinês simplificadoChinês tradicionalCoreanoCroataDinamarquêsEslovacoEslovenoEspanholEstoniano

FinlandêsFrancêsGregoHebraicoHolandêsHúngaroIndonésioInglêsItalianoJaponêsLetãoMalaioNorueguêsPachto

PersaPolonêsPortuguêsRomenoRussoSérvioSuecoTailandêsTchecoTurcoUcranianoUrdu

RESOLVER VARIAÇÕES DE NOMESAs publicações em mídias sociais frequentemente contêmnomes e apelidos com erros de ortografia. O RosetteName Indexer (Indexador de Nome Rosette) aumenta abusca para localizar todas as referências a um nome emtodos os idiomas ou variações de grafia. Uma análisede reputação global da Madonna estará incompleta amenos que as publicações relevantes que grafam seunome como “マドンナ,” “Madonna Ciccone” ou “Madona”também sejam examinadas. O Rosette manipula apelidos,componentes de nomes ausentes, erros e variantes degrafia, nomes desordenados, o mesmo nome escrito emidiomas diferentes e muito mais. Para saber mais sobre osrecursos de correspondência de nomes do Rosette, acessewww.basistech.com/name-indexer.

MÍDIA SOCIAL EM NÚMEROS

• 24,1 milhões de usuários do Facebook na Turquia• 20,5 milhões de usuários do Facebook na França• 18,2 milhões de usuários do Facebook no México• 19,1% dos tuítes são em japonês• 9,6% dos tuítes são em português

Todos esses números são de 2010.

DECIFRE A MÍDIA SOCIAL EM ÁRABEAs conversas on-line em árabe apresentam um desafioespecial porque muitos interlocutores árabes usamcaracteres e números latinos em vez do sistema deescrita tradicional. Sem ser regido por regras formais,o sistema que usa os caracteres latinos pode ser usadointercambiavelmente por um caractere árabe e vice-versa.

QasimGasim8asim

2ulluhom

2illun

Gullhom

O alfabeto do bate-papo em árabe também varia de acordocom o dialeto do interlocutor. A expressão “diga-lhes” podeser escrita como “2ulluhom” por um egípcio, “2illun” por umlibanês ou “Gullhom” no dialeto do Golfo.

Os mecanismos de busca convencionais e analisadoreslinguísticos não conseguem decifrar o alfabeto de bate-papoem árabe. O Rosette abre acesso a esses dados porque:

• Detecta conversas de bate-papo em árabe

• Converte o alfabeto de bate-papo para o árabe nativo

• Encontra nomes pessoais e faz correspondências dessesnomes em várias grafias.