Seq2Seq Chatbot - Utilitar - Brașov - Lucrari 2020 Online

Informatii generale

Descriere

Pe măsură ce tehnologia evoluează, noile descoperiri vizează încercarea de a facilita experiența utilizatorilor. Proiectul are la bază conceptul de Deep Learning și funcționează pe baza unui algoritm capabil să genereze un răspuns la întrebări sau afirmații ale utilizatorilor. Compexitatea aplicației reiese din faptul că ideea reprezintă o încercare de a simula o conversație umană pe o varietate de teme, lucru de multe ori dificil chiar și pentru un om. Pentru realizarea proiectului a fost generată o bază de date pe baza a aproximativ 15 milioane de conversații de pe platforma Reddit, programul reușind să „învețe” cu ajutorul acestora răspundă utilizatorului.

Tehnologii

Programul este scris în Python 3 și utilizează un complex de rețele neuronale recurente de tip „Encoder-Decoder” pentru generarea unei conversații. Algoritmul folosește o bază de date de aproximativ 15 milioane de replici în limba engleză stocată în Google Cloud Bigquery și generează un vocabular cu cele mai frecvente 25.000 de cuvinte, toate celelalte fiind tratate ca și cuvinte necunoscute. Pe baza acestui vocabular, dar și a fiecărei replici in parte se realizează procesul de „antrenament” care are ca scop minimizarea unei funcții de eroare. Prima rețea neuronală încearcă „să înțeleagă” sensul datelor de intrare, cea de-a doua va determina ce importanță are fiecare cuvânt în parte pentru generarea rezultatului, iar cea de-a treia are rolul de a obține un rezultat în funcție de datele obținute de la celelalte două. Procesul de antrenament a fost realizat cu ajutorul platformei Google Research Colab, fiind folosită o placă video Nvidia Tesla P100 și aproximativ 15 GB de memorie RAM. Cu toate acestea aplicația propriu-zisă poate fi rulată pe aproape orice tip de procesor, resursele utilizate fiind minime.

Cerinte sistem

Orice platformă cu Python 3 și minim 2 GB de memorie RAM.
Biblioteci necesare: Tensorflow (2.x), Numpy, Matplotlib, Tkinter, Google.oauth2, Google.cloud

Realizatori

Vlad Arsene

  • Scoala: Colegiul National de Informatica “Grigore Moisil” Brasov
  • Clasa: 12
  • Judet: Brașov
  • Oras: Brasov

Screenshots