Q:
Aký je rozdiel medzi rečou na text a chatovaním?
A:Početné významné rozdiely medzi technológiami reči na text a chatbotmi sú súčasťou toho, čo sa skúma v rýchlom vývoji chatbotových a hlasových projektov.
Technológia konverzie reči na text je jednoducho technológia, ktorá prevádza verbálnu reč na text na digitálnej stránke. Je to jeho úplná funkcia, ale nie je to taká jednoduchá konštrukcia. Za účelom prevodu verbálnej reči na text musí technológia rozobrať slová a vety na jednotlivé fonémy a pracovať s nimi podľa zložitých algoritmov na vytvorení presného textu, ktorý predstavuje to, čo hovoril.
Na druhej strane Chatbots sú technológie, ktoré dosahujú cieľ komunikácie s človekom. Existujú dva typy chatbotov: textové chatboty a hlasové roboty. Textové chatboty sú už omnoho dlhšie, pretože nepotrebujú prvok reči na text, ktorý hlasové roboty využívajú.
Hlavný rozdiel medzi technológiami reči na text a chatami je rozsah. Ako už bolo spomenuté, všetko, čo musí technológia reči na text urobiť, je prepis verbálnej reči. Na druhej strane chatbot musí mať reč v akejkoľvek podobe, v ktorej je vyrobený, musí jej porozumieť a musí poskytnúť odpovede, ktoré sa snažia zložiť Turingov test - test, či technológia dokáže človeka oklamať, aby si myslel, že je on alebo ona. hovoriť s inou osobou.
S týmto vedomím je oveľa jednoduchšie vytvárať chatboty ako hlasové roboty. Chatbot preberie ľudský text a poskytne textovú odpoveď. Dokonca aj relatívne jednoduché chatboty dokázali ľuďom priniesť zaujímavé a príjemné výsledky od konca 80. a začiatku 90. rokov.
Voicebot, na druhej strane, musí prijať verbálnu reč, previesť ju na text, skontrolovať jej presnosť, vyprodukovať odpoveď a túto odpoveď zo strojového jazyka zostaviť na počuteľnú reč. Toto veľké množstvo pomerne dôležitých úloh znamená, že zariadenie Voicebot vyžaduje na zostavenie veľa výpočtového výkonu a veľa dizajnu.
Projekty ako Siri, Cortana a Alexa demonštrujú časť lídra v oblasti technológií hlasového hlasovania. Tiež dokazujú, že táto technológia je ešte stále v plienkach. Aj keď Alexa a ďalšie technológie môžu verbálne reagovať na ľudskú reč, nie sú mimoriadne schopné v tom zmysle, že sa spájame s verbálnou ľudskou rečou všeobecne. Inými slovami, reakcie, ktoré tieto technológie môžu poskytnúť, sú dosť obmedzené. Dnešná generácia osobných asistentov má dokonca obmedzenú schopnosť skutočne vytvárať reč na text, napríklad na účely prepisu e-mailu alebo pomoci niekomu napísať esej bez použitia rúk. Niektoré špecifické programy na reč na text to robia lepšie ako Siri alebo Cortana, pravdepodobne kvôli prideleniu zdrojov. Existujú však náznaky, že sa čoskoro začne postupovať hlasom - napríklad platforma Amazon Lex, ktorá umožňuje štúdiovému prostrediu budovať tieto typy technológií.
V inteligentnej a poučnej eseji na túto tému Tobias Goebel hovorí o rozdieloch medzi týmito technológiami, kontrastuje s procesom „transkripcie“, ktorý prejavuje text, k úlohe porozumenia, ktoré majú robiť chatboti.
„Aj keď eliminuje potrebu rozpoznávania reči, chatbotovi veci uľahčia, hlavnou výzvou na vybudovanie funkčných robotov je porozumenie prirodzenému jazyku, “ píše Goebel.
Goebel identifikuje aj mnohých súčasných hráčov v odbore:
Lídrom na trhu v oblasti rozpoznávania reči je Nuance, ktorá stojí za známymi systémami ako Dragon NaturallySpeaking pre diktovanie na počítači, ktorý existuje už od deväťdesiatych rokov, ale aj za Siri: úloha rozpoznávania a prepisu reči vykonávaná v cloudu Apple využíva Nuance technológia v zákulisí. Ďalšími sú LumenVox, Verbio alebo Interactions, ale rozpoznávanie reči sa teraz ponúka ako cloudová služba prostredníctvom rozhraní API od spoločností Amazon, Google, Microsoft a IBM.
S vývojom chatbotov sa predpokladá, že ich porozumenie sa bude v určitej trajektórii naďalej zvyšovať - a do značnej miery sa tiež predpokladá, že z textových rozhraní na slovné rozhrania prejde viac technológie bot, čo si vyžaduje ďalšie množstvo výpočtového výkonu.