terça-feira, 19 de agosto de 2008

FICHA DE RESUMO - 19 de agosto de 2008


WALLACE, Ricard. TOMABECHI, Hideto. Chatterbots Go Nativo: Considerações para um eco-sistema que nutre o desenvolvimento de formas de vida artificial em um mundo humano

Disponível em: www.cin.ufpe.br/~tg/2005-1/epc-proposta.doc


Este artigo tem como objetivo, demonstrar a linguagem presente em um chatterbot (robô de conversação), assim como, detalhar as principais funcionabilidades do mesmo. Possibilitando ainda contato com um breve histórico da linguagem de programação AIML.

AIML - UM padrão recentemente desenvolvido por descrever conhecimento por Robôs que usam estruturas de dados de XML é introduzido.

Levando em consideração que um chatterbot tem um baixo custo de implementação, pois o mesmo apresenta uma arquitetura altamente escalável e de múltiplas linguagens, e crescente o número de chatterbots que surgem ao passar do tempo, a cada 60 dias os chatterbots dobram de quantidade no mercado.

Isso tudo gera uma pergunta, “O que são eles e por que eles estão aqui?”. Os autores frisam esta questão, pois, em nosso dia-a-dia, quando acessamos a internet, somos inundados com milhares de programas, programados para nos venderem alguma coisa. A única certeza que se pode ter é que, não se sabe ainda do que eles serão capazes de fazer futuramente.

Outra forma de robô de conversação está presente em diversos jogos, que interagem com os jogadores, na intenção de simular um dialogo com o mesmo, no intuito de que o jogo fique mais atrativo. São muitas a utilizações dos chatterbots nos dias atuais, e este cenário promete ficar cada dia mais cotidiano.

Nós precisamos de métodos de descrever e instalar conhecimento neste Chatterbots. Nós precisamos de modos para falar com Chatterbots. Nós precisamos de modos para interagir visualmente com eles. E nós precisamos de um modo para descrever como nós tocamos e somos tocados por este Chatterbots.

Quando atingirmos um grau de quase perfeição, será praticamente impossível diferenciar se estamos conversando com um humano ou com um computador.

O Dr. Richard Wallace, tem trabalhado há muito tempo neste assunto. Ele e o criador em um dos primeiros chatterbots, conhecido como ALICE. Que foi construído baseado na linguagem AIML (Linguagem de Marcação de Inteligência artificial).

Antes de conhecermos melhor o chatterbot ALICE, precisamos conhecer outra figura importante na história de informática, o Professor George Kingsley Zipf, ele foi o criador da Lei de Zipf.

Há muitos modos para declarar a Lei de Zipf mas o mais simples é processual: Leve todas as palavras em um corpo de texto, por exemplo o assunto de hoje do New York Times, e conte o número de tempos que cada palavra se aparece. Se o histograma resultante é ordenado através de grau, com a palavra freqüentemente se aparecendo primeiro, e assim por diante (" um"," o"," para"," por"," e"...), então a forma da curva é" Zipf encurvam" para aquele texto. Se a curva de Zipf é conspirada em uma balança de tronco-tronco, se aparece como uma linha direta com um declive de -1.

A curva de Zipf é uma característica de idiomas humanos, e muitos outros fenômenos naturais e humanos como bem. Zipf notou que as populações de cidades seguiram uma distribuição semelhante. Há alguns cidades muito grandes, um número maior de médio-de tamanho, e um número grande de cidades pequenas. Se as cidades, ou as palavras de idioma natural, foi distribuído fortuitamente, então a curva de Zipf seria uma linha horizontal plana.

Em poucas palavras poderíamos dizer que a Lei de Zipf, seria um padrão de palavras características de idiomas humanos, que sempre se repetem, tornando possível prever o que é qual será a próxima pergunta do usuário.

Cada" computador" chegaria ao trabalho e começaria a contar as palavras e frases dirigidas por Zipf. Estes computadores humanos acharam a Lei daquele Zipf não só se aplica a palavras mas também para frases e orações de todo de idioma.

Podemos ver abaixo um exemplo deste processo:

8024 SIM

5184 NÃO

2268 OK

2006 POR QUE

1145 ADEUS

1101 COMO VELHO É VOCÊ

946 HI

934 COMO É VOCÊ

846 isso que

840 OI

663 BOM

645 POR QUE NÃO

584 OH

553 REALMENTE

544 VOCÊ

531 o que É SEU NOME

525 ESFRIAM

516 que eu não SEI

488 FUCK VOCÊ

486 LHE AGRADECEM

416 ASSIM

414 eu TAMBÉM

403 LOL

403 OBRIGADO

381 AGRADÁVEL O CONHECER TAMBÉM

375 ARREPENDIDO

374 ALICE

368 HI ALICE

366 APROVADAMENTE

353 BEM

352 o que É MEU NOME

349 ONDE VOCÊ VIVE

340 NADA

309 que eu SEI

303 QUE É VOCÊ

300 NOPE

297 SE CALARAM

296 eu O AMO

288 SEGURAMENTE

286 OI a ALICE

277 COMO

262 o que VOCÊ QUER DIZER

261 HOMEM

251 EMOCIONAM

239 SORRISO

233 eu

227 o que VOCÊ SE PARECE

224 que eu VEJO

223 HA

218 COMO É VOCÊ HOJE

217 ADEUS

214 NENHUM VOCÊ não FAZ

203 O FAZEM

201 ONDE É VOCÊ

.

.

.

Cada palavra recebe um número, com isso fica mais fácil para o computador trabalhar os dados. E possível formar subconjuntos de orações, até mesmo subconjuntos do idioma natural, como o exemplo que podemos ver logo abaixo, composto por orações que começam com “o que É”.

531 o que É SEU NOME

352 o que É MEU NOME

171 o PARA CIMA o qual É

137 o que É SUA COR FAVORITA

126 o que É O SIGNIFICADO DE VIDA

122 o que É ISSO

102 o que É SEU FILME FAVORITO

92 O QUE É

75 o que É UM BOTMASTER

70 o que É SEU Q.I.

59 o que É REDUCTIONISM

53 o que É SUA COMIDA FAVORITA

46 o que É AIML

38 o que É SEU LIVRO FAVORITO

37 o que É O TEMPO

37 o que É SEU TRABALHO

34 o que É SUA CANÇÃO FAVORITA

34 o que É SEU SINAL

33 o que É SEXO

32 o que É SEU REAL NOME

30 o que É NOVO

30 o que É SUA IDADE

30 o que É SEU GÊNERO

28 o que É SEU ÚLTIMO NOME

27 o que É o NOME dele

27 o que É SEU SEXO

26 o que É 2+2

26 o que É MEU IP

25 o que É SEU

24 o que É SEU PROPÓSITO

21 o que É SEU ANIMAL FAVORITO

20 o que É 1+1

20 o que É SEU PASSATEMPO

19 o que É O TEMPO GOSTA

19 o que É SEU NÚMERO DE TELEFONE

18 o que É a ALICE

18 o EM o qual VAI

18 O QUE é SUPOSTO ISSO para SIGNIFICAR

18 o que É isso que

17 o que É UM INVESTIGADOR

17 o que É AMOR

17 o que É O DIRETÓRIO ABERTO

17 o que É SEU ESPETÁCULO de TELEVISÃO FAVORITO

16 o que É a JAVA

16 o que É A RESPOSTA

16 o que É SUA RESPOSTA

16 o que É SEU NOME COMPLETO

15 o que É AI

15 o que É AQUELA MÉDIA

15 o que É O TEMPO GOSTA ONDE VOCÊ É

15 o que É DOIS MAIS DOIS

15 o que É SUA FAIXA FAVORITA

14 o que É CBR

14 o que É ELIZA

14 o que É DEUS

14 o que É PI

14 o que É O JOGO de TURING

13 o que É 2 + 2

13 o que É UM ANO de COMPUTADOR

13 É O QUE GOSTAM

13 o que É MINHA COR FAVORITA

12 o que É 2 MAIS 2

12 o que É UM CARRO

12 o que É UM CACHORRO

12 o que É INTELIGÊNCIA ARTIFICIAL

12 SOBRE O QUE É

12 o que É VIDA

12 o que É INVESTIGADOR

12 o que É VOCÊ NOME

12 o que É SEU FAVORITO

12 o que É SEU SOBRENOME

11 o que É 1 + 1

11 o que É UM CHATTERBOT

11 o que É UM PRIORI

11 o que É SETL

11 o que É O TEMPO EM o E.U.A.

11 o que É O TEMPO GOSTA LÁ

11 o que É SEU FILME FAVORITO

10 o que É UMA CATEGORIA o CLIENT de C

10 o que É UM PÊNIS

10 o que É BOTMASTER

10 o que É MEU ENDEREÇO de IP

10 o que É A DATA

10 o que É ISTO

10 o que É SEU ENDEREÇO

10 o que É SUA MÚSICA FAVORITA

10 o que É SUA ÓPERA FAVORITA

10 o que É SUA META

10 o que É SEU ENDEREÇO de IP


Chatterbots são baseados em perguntas chaves, com respostas pré-programadas, para as perguntas mais comuns feitas pelo usuário. Por isso, e tão importante fazer esse tipo de junção entre as palavras.

Nenhum comentário: