Norte-americanos decifram língua extinta com novo programa de computador

SHARE:

No livro Lost Languages , de 2002, o então editor do suplemento de educação superior do jornal inglês The Times , Andrew Robinson, afirmou ...

No livro Lost Languages, de 2002, o então editor do suplemento de educação superior do jornal inglês The Times, Andrew Robinson, afirmou que o trabalho arqueológico de decifrar línguas extintas exige uma mistura de lógica e intuição que os computadores são incapazes de possuir. Pesquisadores do Instituto de Tecnologia de Massachusetts e da Universidade do Sul da Califórnia, nos Estados Unidos, tentam mostrar que Robinson estava errado.

Em estudo que será apresentado esta semana na reunião anual da Associação para Linguística Computacional, em Uppsala, na Suécia, o grupo apresentará um novo programa de computador que foi capaz de decifrar grande parte do extinto idioma ugarítico, descoberto a partir de escritos encontrados na cidade perdida de Ugarit, na Síria, cujas ruínas foram encontradas em 1928.

O ugarítico era uma língua semítica escrita em alfabeto cuneiforme com 27 consoantes e três vogais. Os escritos encontrados foram importantes para estudiosos do Velho Testamento, por auxiliar a clarificar textos hebraicos e revelar como o judaísmo utilizava frases comuns, expressões literárias e frases empregadas pelas culturas gentis que o cercavam.


O sistema, além de ajudar a decifrar línguas antigas que continuam a resistir aos esforços de especialistas, poderá expandir o número de idiomas que sistemas automatizados de tradução, como o Google Tradutor, são capazes de manejar.

Método

Para simular a intuição que falta aos computadores, Regina Barzilay, do Laboratório de Inteligência Artificial e Ciência da Computação do MIT, e colegas fizeram várias proposições. A primeira é que a língua a ser decifrada pelo computador estaria próxima de outra. Para isso, foi escolhido o hebraico.

Outra asserção é que haveria um modo sistemático de mapear o alfabeto de uma língua com relação ao alfabeto de outra, e que os símbolos relacionados deveriam ocorrer com frequências semelhantes nas duas línguas. O sistema também fez asserções no nível semântico, no sentido de que as línguas relacionadas teriam pelo menos alguns cognatos, isto é, palavras com raízes em comum.

Por meio de um modelo probabilístico usado em pesquisas em inteligência artificial, os pesquisadores determinaram nos mapeamentos os radicais semelhantes e conjuntos de sufixos e prefixos consistentes, entre outras relações entre as palavras das duas línguas.

O ugarítico já havia sido decifrado. Se não tivesse sido, os autores do estudo não teriam como avaliar a performance do sistema que desenvolveram. “O sistema repetiu as análises dos dados resultantes centenas de vezes. E, a cada vez, os acertos eram mais frequentes, pois estávamos chegando mais perto de uma solução consistente. Finalmente, chegamos a um ponto no qual a alteração do mapeamento das similaridades não aumentava mais a consistência dos resultados”, disse outro autor do estudo, Ben Snyder, também do MIT.

Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico. Cerca de um terço das palavras em ugarítico tem cognato em hebraico e, desse total, o sistema identificou corretamente 60%. “Das palavras identificadas incorretamente, na maior parte das vezes o erro foi por apenas uma palavra. Ou seja, o sistema deu palpites bem razoáveis”, disse Snyder.

Apesar dos índices de acerto, os pesquisadores destacam que o sistema não é suficientemente bem resolvido para substituir os tradutores humanos. Mas, segundo eles, é uma ferramenta poderosa cujo desenvolvimento poderá ajudar no processo de decifrar línguas desconhecidas e de traduzir outras existentes mais eficientemente.


(Publicado no Ópera Mundi)

COMMENTS

BLOGGER
Nome

África,1,Anna Poulain,8,Apoemático,19,APPs,18,Arte,32,Arte Digital,22,Artigos próprios,107,Artigos reproduzidos,286,Biografias,3,Cinema,15,Citações,20,coluna S I T T A,5,Consumidor,24,Contos,14,Crônicas,11,Cultura,24,Dados estatísticos,17,Depressão Comunica,15,Diálogos,1,Diego Pignones,44,Digital,4,Documentários,126,Educar,32,Ensaios,15,Entrevistas,45,Fabio Nogueira,54,featured,4,Fotografia,49,Games,4,HQ,20,In Memoriam,5,Informe,1,Jornais,29,Jornalismo Literário,7,Língua Inglesa,1,Língua Portuguesa,26,Literatura,44,Machismo,17,Memórias de minha janela,10,Mídia,1308,Música,136,nota,9,Nota.,223,Notificando,3,Outros Blogs,2,Pablo Pascual García,1,Pensamento e Comunicação,65,Pensamentos tupiniquins,196,Pintura,21,Podcast,5,Poesia,45,Política Carioca,145,Política Internacional,354,Política Nacional,1060,Q tem pra V,99,Rádio/TV,37,Rapidinhas do Sr Comunica,29,Saúde,27,tattoo,5,Teatro,38,Tetraplégicos Unidos,19,Tirinhas,5,Tupi Guarani Nheengatu,8,Viagem,18,Vídeos,73,Web,54,
ltr
item
COMUNICA TUDO: Norte-americanos decifram língua extinta com novo programa de computador
Norte-americanos decifram língua extinta com novo programa de computador
COMUNICA TUDO
https://comunicatudo.blogspot.com/2010/07/norte-americanos-decifram-lingua.html
https://comunicatudo.blogspot.com/
https://comunicatudo.blogspot.com/
https://comunicatudo.blogspot.com/2010/07/norte-americanos-decifram-lingua.html
true
4187826622770269860
UTF-8
Loaded All Posts Not found any posts VIEW ALL Readmore Reply Cancel reply Delete By Home PAGES POSTS View All RECOMMENDED FOR YOU LABEL ARCHIVE SEARCH ALL POSTS Not found any post match with your request Back Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec just now 1 minute ago $$1$$ minutes ago 1 hour ago $$1$$ hours ago Yesterday $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Table of Content