Sistem De Conversație Bazat Pe Inteligență Buatană: 6 Langkah
Sistem De Conversație Bazat Pe Inteligență Buatană: 6 Langkah
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

Pengarang: Stanut Nicolae-Radu

Grup: 333AB

Catatan: 8

Langkah 1: Deskripsi Fungsional

Deskripsi Fungsională
Deskripsi Fungsională

n principiu sistemul va fi asemănător

asistenților inteligenți pentru casă de tipul Google Assistant i Amazon Alexa, utilizatorii pot da comenzi vocale aparatului, iar acesta va răspunde sau va face o anumită acțiune, n funcție de cerințele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că terpisah dari Wi-Fi, acet lucru permițând conectarea la serviciul cloud Amazon, care va da inteligență” sistemului.

Folosind serviciul de cloud i inteligență artificială de la Amazon, acet dispozitiv va avea o funcționalitate praktik identic cu Amazon Alexa. Contoh acest asistent virtual poate prezenta tatapan meteo, poate ine minte notițe, poate pune alarme, dar din păcate(sau fericire ?), aceste lucruri depind n totalitate de Amazon, iar comenzile dispozitivului se dau n limba engleză.

Ca i obiectiv secundar, voi ncerca să integrez limba română astfel ncât asistentul să poată nțelege i comenzi i de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor procese, de exemplu aprinderea i stingerea unor lumini, oprirea unei prize. Desigur, doar dacă API-ul Amazon va permite aceste lucruri.

Lihat selengkapnya:

Langkah 2: Komponen

Pentru realizarea proiectului am avut nevoie de următoarele componente:

  1. Raspberry PI 3 B+

    Komputer mini terbaik dengan proiectului kreierul, aturan modifikasi yang pasti untuk Linux Debian untuk prosesor ARM. De asemenea, model terbaik, terpisah dari wi-fi, koneksi internet, dan mutlak diperlukan, pentru motoarele de teks-dalam-vorbire, dan vorbire-în-teks

  2. Kamera Mata PS

    Pe post microfon ("urechea proiectului") am ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită

  3. Kotak, portabel,

    Pentru a transmite informația către utilizator a fost nevoie de un difuzor, am folosit o boxă cu fir primită de la un prieten

  4. 2 api + LED
  5. kaserolă

    Carcasa proiectului, atau caserolă de sarmale:D

Langkah 3: Perangkat Keras

Perangkat keras
Perangkat keras

Dup ce am adunat componentele, am trecut la implementare, schema este una foarte simplă. Portabil kotak untuk terhubung ke portul USB pentru alimentare untuk portul jack pemutaran pentru, kamera/mikrofon untuk koneksi doar la portul Komunikasi perawatan dasar USB di komputer-ul. Am mai adăugat n schemă i led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Komplikasi Nimik.

Langkah 4: Perangkat Lunak

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator(voce), să transform datele ntr-un format accesibil lui(text) i să le redea răspunsul sau confirmarea unei acțiuni napoi(voce). Pentru acestea a fost nevoie de 3 servicii terpisah:

  1. Un motor Speech-to-Text (STT), pentru a prelua datele de intrare(informațiile transmise de utilizator prin vorbire)
  2. Un sistem de inteligen artificială, pentru a lua decizii i a rezolva probleme
  3. Un motor Text-to-Speech (TTS), pentru a transmite utilizatorului răspunsurile sau confirmările acțiunilor

Pentru STT am folosit API-ul de la Google, denumit Google Speech API, care este gratuit, oferă o calitate mare a conversiei i o rată mică de erori, dar oferă i un număr limitat de apeluri. Am ales acet API datorită faptului că această parte a sistemului este cea mai sensibilă la erori i cea mai supusă la perturbații. Batas data, kerasnya perangkat keras komputer (putere de procesare, spațiu de stocare, memorie), folosirea unui serviciu offline este exclus, a că am optat pentru un serviciu Cloud, oferind i o precizie mai mare, dar i un timp de mare, Google avand unul dintre cele mai bune motoare STT.

Pentru feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare consumator de resurse i nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Pidato Sistem Sintesis, perawatan este oferit gratis sub o liceță de tipul MIT. Vocea este una ușor robotică, dar mult mai inteligibilă față de eSpeak, alt motor TTS offline. Avantajul său față de serviciile online este că nu are niciun fel de limitare la numărul de coverii.

Liantul dintre STT i TTS, precum i partea "iteligentă" este platforma denumită Jasper. O platformă Sumber Terbuka, buka GitHub untuk tautan-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile decrise mai sus i ia decizii n funcție de input-ul utilizatorului. Sesuaikan dengan Raspberry PI, temukan skrip di Python. Lebih baik daripada yang lain untuk merugikan Cloud datorit, modularității, platform yang diizinkan untuk digunakan atau diservis STT dan TTS, dari yang sudah ditentukan atau yang akan digunakan untuk mengikuti program Python.

Sistemul de inteligență buatană este unul prosedural, am optat pentru această variană n detrimentul sistemelor de tip Machine Learning (chatbot) din cauză că cele din urmă au un caracter nedeterminist. Natura platformei Jasper, fiind bazată pe comenzi i acțiuni predefinite, limitează capacitatea de convorbire, dar oferă un cadru potrivit pentru un asistent digital, acesta fiind i scopul proiectului.

Langkah 5: Implementasi

  1. Menginstal sistemul de operare Raspbian pe cardul microSD
  2. Apakah kamera conectat i difuzorul la Raspberry
  3. Mengkonfigurasi sistemul de operare, după care am instalat toate bibliotecile i serviciile need, urmând toți pașii din acest ghid:
  4. Sedang membuat i instalat module tambahan pentru a extinde funcționalitatea sistemului

Langkah 6: Memanfaatkan

Image
Image
Memanfaatkan
Memanfaatkan
Memanfaatkan
Memanfaatkan

Din lipa unui monitor am configurat dispozitivulu s se conecteze la o rețea nirkabel predefinită, kontrol dispozitivului realizându-se prin SSH. Jasper permite două tipuri de interacțiune:

  1. Terminal cetak(teks) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

Din simplitate voi ncepe demonstrarea funcionalității prin intermediul terminalului. La rularea comenzii jasper_cli va fi afișat un mesaj de ntâmpinare, iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • DEFINE + cuvânt - ntoarce definiția din dicționar a cuvântului respectiv
  • SIAPA, APA, BERAPA, BERAPA BANYAK, BERAPA LAMA + CUVânt - folosește API-ul wolframalpha pentru a răspunde la ntrebări generale
  • WIKI - folosește API-ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • JOKE - spune o glumă
  • LUMOS/NOX - aprinde/stinge LED-ul atașat
  • TRIVIA
  • MOVIES - informații despre filme (imdb)
  • BERITA - citește tiri

Dalam modul suara, deschis la introdure comenzii "jasper" n linia de comandă, dispozitivul se pune n modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. n cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul a auzit cuvântul cheie, acesta intră n modul de ascultare, putând să primească comenzi exact ca i n modul teks. După executarea comenzii, dispozitivul intră din nou n așteptare până la o nouă trezire a sa.

Direkomendasikan: