WALLACE, Ricard. TOMABECHI, Hideto. Chatterbots Go Nativo: Considerações para um eco-sistema que nutre o desenvolvimento de formas de vida artificial em um mundo humano
Disponível em: www.cin.ufpe.br/~tg/2005-1/epc-proposta.doc
Este artigo tem como objetivo, demonstrar a linguagem presente em um chatterbot (robô de conversação), assim como, detalhar as principais funcionabilidades do mesmo. Possibilitando ainda contato com um breve histórico da linguagem de programação AIML.
AIML - UM padrão recentemente desenvolvido por descrever conhecimento por Robôs que usam estruturas de dados de XML é introduzido.
Levando em consideração que um chatterbot tem um baixo custo de implementação, pois o mesmo apresenta uma arquitetura altamente escalável e de múltiplas linguagens, e crescente o número de chatterbots que surgem ao passar do tempo, a cada 60 dias os chatterbots dobram de quantidade no mercado.
Isso tudo gera uma pergunta, “O que são eles e por que eles estão aqui?”. Os autores frisam esta questão, pois, em nosso dia-a-dia, quando acessamos a internet, somos inundados com milhares de programas, programados para nos venderem alguma coisa. A única certeza que se pode ter é que, não se sabe ainda do que eles serão capazes de fazer futuramente.
Outra forma de robô de conversação está presente em diversos jogos, que interagem com os jogadores, na intenção de simular um dialogo com o mesmo, no intuito de que o jogo fique mais atrativo. São muitas a utilizações dos chatterbots nos dias atuais, e este cenário promete ficar cada dia mais cotidiano.
Nós precisamos de métodos de descrever e instalar conhecimento neste Chatterbots. Nós precisamos de modos para falar com Chatterbots. Nós precisamos de modos para interagir visualmente com eles. E nós precisamos de um modo para descrever como nós tocamos e somos tocados por este Chatterbots.
Quando atingirmos um grau de quase perfeição, será praticamente impossível diferenciar se estamos conversando com um humano ou com um computador.
O Dr. Richard Wallace, tem trabalhado há muito tempo neste assunto. Ele e o criador em um dos primeiros chatterbots, conhecido como ALICE. Que foi construído baseado na linguagem AIML (Linguagem de Marcação de Inteligência artificial).
Antes de conhecermos melhor o chatterbot ALICE, precisamos conhecer outra figura importante na história de informática, o Professor George Kingsley Zipf, ele foi o criador da Lei de Zipf.
Há muitos modos para declarar a Lei de Zipf mas o mais simples é processual: Leve todas as palavras em um corpo de texto, por exemplo o assunto de hoje do New York Times, e conte o número de tempos que cada palavra se aparece. Se o histograma resultante é ordenado através de grau, com a palavra freqüentemente se aparecendo primeiro, e assim por diante (" um"," o"," para"," por"," e"...), então a forma da curva é" Zipf encurvam" para aquele texto. Se a curva de Zipf é conspirada em uma balança de tronco-tronco, se aparece como uma linha direta com um declive de -1.
A curva de Zipf é uma característica de idiomas humanos, e muitos outros fenômenos naturais e humanos como bem. Zipf notou que as populações de cidades seguiram uma distribuição semelhante. Há alguns cidades muito grandes, um número maior de médio-de tamanho, e um número grande de cidades pequenas. Se as cidades, ou as palavras de idioma natural, foi distribuído fortuitamente, então a curva de Zipf seria uma linha horizontal plana.
Em poucas palavras poderíamos dizer que a Lei de Zipf, seria um padrão de palavras características de idiomas humanos, que sempre se repetem, tornando possível prever o que é qual será a próxima pergunta do usuário.
Cada" computador" chegaria ao trabalho e começaria a contar as palavras e frases dirigidas por Zipf. Estes computadores humanos acharam a Lei daquele Zipf não só se aplica a palavras mas também para frases e orações de todo de idioma.
Podemos ver abaixo um exemplo deste processo:
8024 SIM
5184 NÃO
2268 OK
2006 POR QUE
1145 ADEUS
1101 COMO VELHO É VOCÊ
946 HI
934 COMO É VOCÊ
846 isso que
840 OI
663 BOM
645 POR QUE NÃO
584 OH
553 REALMENTE
544 VOCÊ
531 o que É SEU NOME
525 ESFRIAM
516 que eu não SEI
488 FUCK VOCÊ
486 LHE AGRADECEM
416 ASSIM
414 eu TAMBÉM
403 LOL
403 OBRIGADO
381 AGRADÁVEL O CONHECER TAMBÉM
375 ARREPENDIDO
374 ALICE
368 HI ALICE
366 APROVADAMENTE
353 BEM
352 o que É MEU NOME
349 ONDE VOCÊ VIVE
340 NADA
309 que eu SEI
303 QUE É VOCÊ
300 NOPE
297 SE CALARAM
296 eu O AMO
288 SEGURAMENTE
286 OI a ALICE
277 COMO
262 o que VOCÊ QUER DIZER
261 HOMEM
251 EMOCIONAM
239 SORRISO
233 eu
227 o que VOCÊ SE PARECE
224 que eu VEJO
218 COMO É VOCÊ HOJE
217 ADEUS
214 NENHUM VOCÊ não FAZ
203 O FAZEM
201 ONDE É VOCÊ
.
.
.
Cada palavra recebe um número, com isso fica mais fácil para o computador trabalhar os dados. E possível formar subconjuntos de orações, até mesmo subconjuntos do idioma natural, como o exemplo que podemos ver logo abaixo, composto por orações que começam com “o que É”.
531 o que É SEU NOME
352 o que É MEU NOME
171 o PARA CIMA o qual É
137 o que É SUA COR FAVORITA
126 o que É O SIGNIFICADO DE VIDA
122 o que É ISSO
102 o que É SEU FILME FAVORITO
92 O QUE É
75 o que É UM BOTMASTER
70 o que É SEU Q.I.
59 o que É REDUCTIONISM
53 o que É SUA COMIDA FAVORITA
46 o que É AIML
38 o que É SEU LIVRO FAVORITO
37 o que É O TEMPO
37 o que É SEU TRABALHO
34 o que É SUA CANÇÃO FAVORITA
34 o que É SEU SINAL
33 o que É SEXO
32 o que É SEU REAL NOME
30 o que É NOVO
30 o que É SUA IDADE
30 o que É SEU GÊNERO
28 o que É SEU ÚLTIMO NOME
27 o que É o NOME dele
27 o que É SEU SEXO
26 o que É 2+2
26 o que É MEU IP
25 o que É SEU
24 o que É SEU PROPÓSITO
21 o que É SEU ANIMAL FAVORITO
20 o que É 1+1
20 o que É SEU PASSATEMPO
19 o que É O TEMPO GOSTA
19 o que É SEU NÚMERO DE TELEFONE
18 o que É a ALICE
18 o EM o qual VAI
18 O QUE é SUPOSTO ISSO para SIGNIFICAR
18 o que É isso que
17 o que É UM INVESTIGADOR
17 o que É AMOR
17 o que É O DIRETÓRIO ABERTO
17 o que É SEU ESPETÁCULO de TELEVISÃO FAVORITO
16 o que É a JAVA
16 o que É A RESPOSTA
16 o que É SUA RESPOSTA
16 o que É SEU NOME COMPLETO
15 o que É AI
15 o que É AQUELA MÉDIA
15 o que É O TEMPO GOSTA ONDE VOCÊ É
15 o que É DOIS MAIS DOIS
15 o que É SUA FAIXA FAVORITA
14 o que É CBR
14 o que É ELIZA
14 o que É DEUS
14 o que É PI
14 o que É O JOGO de TURING
13 o que É 2 + 2
13 o que É UM ANO de COMPUTADOR
13 É O QUE GOSTAM
13 o que É MINHA COR FAVORITA
12 o que É 2 MAIS 2
12 o que É UM CARRO
12 o que É UM CACHORRO
12 o que É INTELIGÊNCIA ARTIFICIAL
12 SOBRE O QUE É
12 o que É VIDA
12 o que É INVESTIGADOR
12 o que É VOCÊ NOME
12 o que É SEU FAVORITO
12 o que É SEU SOBRENOME
11 o que É 1 + 1
11 o que É UM CHATTERBOT
11 o que É UM PRIORI
11 o que É SETL
11 o que É O TEMPO
11 o que É O TEMPO GOSTA LÁ
11 o que É SEU FILME FAVORITO
10 o que É UMA CATEGORIA o CLIENT de C
10 o que É UM PÊNIS
10 o que É BOTMASTER
10 o que É MEU ENDEREÇO de IP
10 o que É A DATA
10 o que É ISTO
10 o que É SEU ENDEREÇO
10 o que É SUA MÚSICA FAVORITA
10 o que É SUA ÓPERA FAVORITA
10 o que É SUA META
10 o que É SEU ENDEREÇO de IP
Chatterbots são baseados em perguntas chaves, com respostas pré-programadas, para as perguntas mais comuns feitas pelo usuário. Por isso, e tão importante fazer esse tipo de junção entre as palavras.
Nenhum comentário:
Postar um comentário