Roubo, rapto e violação de autoria: a linguística forense na detecção do crime de plágio
Rui Sousa Silva [email protected]
Escola de Verão – CLUP 3 de Julho de 2009
Água mole em pedra dura…
Idiossincrasias na linguagem Sociolecto/Idiolecto Perfis de personalidade vs. Perfis linguísticos Intuição vs. estudos empíricos Lofoscopia linguística – ou como lidar com o
trauma de ter a casa assaltada… Autoria
A propriedade das palavras
Grécia Antiga: autoria, autoridade das fontes e credibilidade
Filosofia humanista do Renascimento: conceitos modernos de indivíduo, de autoria e de autor individual
Século XV: invenção da imprensa, atribuída a Gutenberg, e os cânones textuais tradicionais
Impressão em série e cariz económico
A propriedade das palavras
Séc. XVI: desenvolvimento da escrita enquanto profissão / declínio do patronato na literatura
Questões económicas: papel preponderante na escrita, aumento das preocupações com o usufruto e cópia
Roubo da “palavra escrita”
A propriedade das palavras
1624: Bispo Richard Montagu e a metáfora da palavra “plágio”
Latim plagiarius (“raptor”) + Grego plagion (“rapto”) num contexto literário
Palavras começam a ser vistas como propriedade
Séc. XVIII, UK: 1.ª legislação para gerir casos de plágio e violação dos direitos de autor
A propriedade das palavras
Escritores e editores: usufruto de direitos legais sobre os seus textos
Neoclassicismo: reconsidera conceito imitação Novo destaque à originalidade na escrita Séc. XVIII: e.g. Alexander Pope e Samuel
Johnson: alerta para casos de plágio Conceito de propriedade de bens considerados
morais – não materiais
A propriedade das palavras
Nível mundial: criação + regulamentação de normas e acordos internacionais de direitos de autor (e.g., Convenção de Berna)
Protecção direitos autor – nacional e países signatários da Convenção
Plágio vs. Direito de Autor Questionar propriedade de bem comum,
socialmente partilhável e partilhado: palavras…
A propriedade das palavras
…e originalidade Confusão frequente com estilo, na literatura Intuição e déjà-vu: mais acentuada quanto mais
marcado (=original) estilo do autor Aumento drástico do volume de produção
literária Mais difícil garantir consagração do direito de
autoria individual
(Des)Ajuda dos recursos informáticos
Informática Ajuda a plagiar Ajuda a captar plagiadores
Capacidades da Internet Recursos utilizados pelos estudantes Muito trabalho, rapidamente Plágio
Definições de plágio
Divulgação de conteúdos sem indicação clara do autor original com intuito de assumir a autoria (Sérgio Nunes)
Divulgação de conteúdos sem indicação clara do autor original com intuito de assumir a autoria (Sérgio Nunes)
Definições de plágio
Roubo de produto intelectual. Quem comete o plágio apresenta como sendo seu o texto ou as ideias de outrém, não dá os créditos ao autor original (Françoise Bacquelaine)
Roubo de produto intelectual. Quem comete o plágio apresenta como sendo seu o texto ou as ideias de outrém, não dá os créditos ao autor original (Françoise Bacquelaine)
Definições de plágio
Utilização abusiva de palavras e ideias pertencentes a outros, concretizando-se na cópia parcial ou integral das mesmas por parte daquele(s) que as tomam como suas (Raquel Cabral)
Utilização abusiva de palavras e ideias pertencentes a outros, concretizando-se na cópia parcial ou integral das mesmas por parte daquele(s) que as tomam como suas (Raquel Cabral)
Definições de plágio
Processo de criação simulada de um texto, por execução de operações mínimas de edição sobre um texto já existente; b) atribuição da autoria ao produtor de um texto criado por edição mínima de um texto existente, sem que este seja acompanhado da referência ao texto editado. (Félix)
Processo de criação simulada de um texto, por execução de operações mínimas de edição sobre um texto já existente; b) atribuição da autoria ao produtor de um texto criado por edição mínima de um texto existente, sem que este seja acompanhado da referência ao texto editado. (Félix)
Definições de plágio
Utilização total ou parcial de uma obra intelectual (texto, som, video, imagem, etc) sem a autorização do autor. (Paulo Santos)
Utilização total ou parcial de uma obra intelectual (texto, som, video, imagem, etc) sem a autorização do autor. (Paulo Santos)
Definição de Plágio
Plágio é, por conseguinte, apresentar intencionalmente as ideias, o trabalho e as
palavras de outrém sem uma atribuição adequada, clara e desambígua.
(2009, prelo)
Plágios - exercícios
Um abstract de 250 palavras construído a partir de excertos retirados da Internet, sobre um tema do vosso interesse. Aquilo que peço é que retirem excertos entre 80 e 100 palavras da Internet, os “colem” para construir um texto e façam um mínimo de correcções.
Plágios - António Paulo Santos
In this paper I present the advantages of making corpora available on the World Wide Web, proposing that a resource network of Portuguese corpora is established. First, I discuss the advantages of having and making text corpora available, both for corpus providers and for corpus users and, more generally, for anyone interested in studying language and/or working with natural language processing. I then proceed to suggest some reasons why so far there are so few corpora of Portuguese generally available, describing legal and economic problems, technical difficulties, and cultural impedments. With reference to my previous work with the Oslo Corpus of Bosnian Texts as an example, I list the advantages of making corpora available, from three perspectives: general properties of WWW-based systems, specific advantages for corpus compilers, and for corpus users. Finally, I suggest that Evaluation Contests for Portuguese, based on available corpus data, are organized. http://www.linguateca.pt/Diana/download/abs_WLC.html In this last subsection, by far the largest, we discuss linguistic expressiveness, query power, result presentation, structure encoding, punctuation handling, as well as features existing only in one of the systems, such as the graphical interface for creating disambiguating grammars of INTEX, and the invocation of external programs as virtual attributes of the IMS-CWB. We conclude pointing out the different underlying philosophies of the two systems, as well as stating that many of each systems capabilties were not even mentioned, let alone discussed, for lack of space. http://www.linguateca.pt/Diana/download/abs_propor99.html
Plágios - Sérgio Nunes
A Recuperação de Informação tem por objectivo obter automaticamente respostas a perguntas sobre grandes colecções de documentos. As respostas podem tomar formas diversas, de listas de documentos a sumários dos mesmos, de elementos em documentos XML a entidades existentes nos documentos. Nalgumas áreas da recuperação de informação existem já ferramentas cujo uso se generalizou e que são a base do acesso à informação em linha; é o caso dos motores de busca na web. http://www.fe.up.pt/si/disciplinas_geral.formview?p_cad_codigo=PRODEI025&p_ano_lectivo=2008/2009&p_periodo=2S O grande volume de informação produzidos pelas várias organizações e pelas pessoas individualmente, já não se compadece com os arquivos tradicionais em papel, quer pelo seu volume quer pelo tempo necessário para localizar e aceder. É muito mais atractivo armazenar e aceder a informação em suporte digital. A maior parte de informação que se produz todos os dias é disponibilizada em formato não estruturado ou semi-estruturado, que não se compadece com as Bases de Dados convencionais: texto, imagens video, som e documentos multimedia. Isto faz com que esteja cada vez mais na ordem do dia as tecnologias de pesquisa de armazenamento de informação que até aqui estavam limitadas a uma utilização mais especializada.
http://marco.uminho.pt/~macedo/mir/index.html
Plágios – Félix do Carmo
Os partidos de esquerda conseguiram 23% dos votos, quase um em cada quatro. Não há nenhum país da União Europeia onde a esquerda “radical” tenha alcançado resultados tão claros. Isto só pode ser explicado pela percepção que o eleitorado tem de que, por cá, ao contrário do que acontece no resto da Europa, a social-democracia desapareceu dos partidos de governo, que têm preferido colar-se aos interesses corporativos. Parece haver cada vez mais portugueses a perceber que não há qualquer diferença em votar PS ou PSD. Óptimo. Outro dado curioso é a assombrosa quantidade de idiotas que, em 13 partidos não conseguiu encontrar nenhum que lhe agrade. 236 000 pessoas votaram branco ou nulo. Sentirão talvez a falta de um Partido da Santola, de um Partido CR7 ou de um Partido do Benfica? Inaceitável. O terceiro facto relevante é o elevado número de abstencionistas, que representa um indício claro de que o eleitorado não acredita na sua capacidade de influenciar o rumo político da UE. Se quem decide tudo são os boys da comissão europeia, para quê dar-se ao trabalho de brincar às eleições como se houvesse democracia? Os líderes políticos europeus vão continuar a fazer de conta que é normal uma participação eleitoral de 40% e que a abstenção de 60% não significa nada. Ilações, não vão tirar nenhumas. Incompreensível. http://eumeswill.wordpress.com/2009/06/08/rescaldo/
Plágios – Félix do Carmo
Os partidos de esquerda-esquerda (CDU, BE, PCTP, POUS) conseguiram 23% dos votos, quase um em cada quatro. Não há mais nenhum país da União Europeia onde a esquerda dita “radical” tenha alcançado resultados tão expressivos. O que só se explica pela percepção que o eleitorado tem de que por cá, ao contrário do que acontece no norte da Europa, a social-democracia desapareceu há muito do horizonte ideológico dos partidos ditos de governo, que têm preferido colar-se à gamela dos interesses corporativos. Parece haver cada vez mais portugueses, portanto, a perceber que votar PS ou PSD é praticamente o mesmo. Óptimo. Outro dado curioso é a assombrosa quantidade de idiotas que, em 13 partidos – com um leque de opções que vai da extrema-esquerda à extrema direita, passando pelos monárquicos – não conseguiu encontrar nenhum que lhe agrade. 236 000 pessoas foram às urnas para votar branco ou nulo. Sentirão talvez a falta de um Partido da Santola, de um Partido CR7 ou de um Partido do Benfica? Incompreensível. O terceiro facto relevante é, obviamente, o elevado número de abstencionistas. Um indício claro de que o eleitorado não acredita na sua capacidade de influenciar o rumo político da UE. Se quem decide tudo são os boys da comissão europeia e quejandos, nos seus gabinetes à prova de som, para quê dar-se ao trabalho de brincar às eleições como se houvesse democracia nisso? Os líderes políticos europeus vão continuar a fazer de conta, claro, que é normal uma participação eleitoral de 40 % e que a abstenção dos restantes 60 % não significa nada. Ilações, não vão tirar nenhumas. Pulhas. http://eumeswill.wordpress.com/2009/06/08/rescaldo/
Selecção dos abstracts
O Sérgio e o Paulo: provavelmente não seriam seleccionados, com
acusação de plágio Ficariam com oom o nome “manchado” como
cientistas IEEE: não poderiam publicar durante anos
Félix: O abstract passaria por original, lógico e pertinente… É menos plágio?
Selecção dos abstracts
Não é original; tão plágio como os restantes Intercala/corta as frases com ligeiras alterações
– dificuldade de detecção por sistemas de plágio actuais (baseados em strings com um mínino de palavras coincidentes)
Fraqueza: riqueza lexical
Contribuição da Ling. Computacional
Agilizar sistemas de pesquisa em rede Análise estatística de dados significativos como
riqueza lexical Consideração de aspectos de tradução:
recursos como Metra, Google Translate… Integração com recursos como o ParaMT
Roubo, rapto e violação de autoria: a linguística forense na detecção do crime de plágio
Rui Sousa Silva [email protected]
Escola de Verão – CLUP 3 de Julho de 2009
Top Related