Informatii generale
- Categorie: Utilitar
- Judetul: Brașov
- Surse: GitHub - Arsuh/Seq2Seq-Chatbot
Descriere
Pe măsură ce tehnologia evoluează, noile descoperiri vizează încercarea de a facilita experiența utilizatorilor. Proiectul are la bază conceptul de Deep Learning și funcționează pe baza unui algoritm capabil să genereze un răspuns la întrebări sau afirmații ale utilizatorilor. Compexitatea aplicației reiese din faptul că ideea reprezintă o încercare de a simula o conversație umană pe o varietate de teme, lucru de multe ori dificil chiar și pentru un om. Pentru realizarea proiectului a fost generată o bază de date pe baza a aproximativ 15 milioane de conversații de pe platforma Reddit, programul reușind să „învețe” cu ajutorul acestora răspundă utilizatorului.
Tehnologii
Programul este scris în Python 3 și utilizează un complex de rețele neuronale recurente de tip „Encoder-Decoder” pentru generarea unei conversații. Algoritmul folosește o bază de date de aproximativ 15 milioane de replici în limba engleză stocată în Google Cloud Bigquery și generează un vocabular cu cele mai frecvente 25.000 de cuvinte, toate celelalte fiind tratate ca și cuvinte necunoscute. Pe baza acestui vocabular, dar și a fiecărei replici in parte se realizează procesul de „antrenament” care are ca scop minimizarea unei funcții de eroare. Prima rețea neuronală încearcă „să înțeleagă” sensul datelor de intrare, cea de-a doua va determina ce importanță are fiecare cuvânt în parte pentru generarea rezultatului, iar cea de-a treia are rolul de a obține un rezultat în funcție de datele obținute de la celelalte două. Procesul de antrenament a fost realizat cu ajutorul platformei Google Research Colab, fiind folosită o placă video Nvidia Tesla P100 și aproximativ 15 GB de memorie RAM. Cu toate acestea aplicația propriu-zisă poate fi rulată pe aproape orice tip de procesor, resursele utilizate fiind minime.
Cerinte sistem
Orice platformă cu Python 3 și minim 2 GB de memorie RAM.
Biblioteci necesare: Tensorflow (2.x), Numpy, Matplotlib, Tkinter, Google.oauth2, Google.cloud
Realizatori
Vlad Arsene
- Scoala: Colegiul National de Informatica “Grigore Moisil” Brasov
- Clasa: 12
- Judet: Brașov
- Oras: Brasov