Uživatelské rozhraní v přirozeném jazyce - Natural-language user interface

Uživatelské rozhraní v přirozeném jazyce ( LUI nebo NLUI ) je typ lidského rozhraní počítače, kde jazykové jevy, jako jsou slovesa, fráze a doložky, fungují jako ovládací prvky uživatelského rozhraní pro vytváření, výběr a úpravu dat v softwarových aplikacích.

V návrhu rozhraní jsou rozhraní přirozeného jazyka vyhledávána pro svou rychlost a snadné použití, ale většina z nich čelí problémům s porozuměním široké škále nejednoznačných vstupů . Rozhraní v přirozeném jazyce jsou aktivní oblastí studia v oblasti zpracování přirozeného jazyka a počítačové lingvistiky . Jedním z aktivních cílů sémantického webu je intuitivní obecné rozhraní v přirozeném jazyce .

Textová rozhraní jsou v různé míře „přirozená“. Mnoho formálních (nepřirozených) programovacích jazyků obsahuje idiomy přirozeného lidského jazyka. Stejně tak by mohl být tradiční vyhledávač klíčových slov popsán jako „mělké“ uživatelské rozhraní v přirozeném jazyce.

Přehled

V přirozeném jazyce by vyhledávač teoreticky našel cílené odpovědi na otázky uživatelů (na rozdíl od vyhledávání podle klíčových slov). Když jsou například konvenční vyhledávače konfrontovány s otázkou typu „který stát USA má nejvyšší daň z příjmu ?“, Tuto otázku ignorují a místo toho hledají klíčová slova „stát“, „příjem“ a „daň“. Hledání v přirozeném jazyce se na druhé straně pokouší použít zpracování v přirozeném jazyce k pochopení podstaty otázky a poté k vyhledávání a vrácení podmnožiny webu, která obsahuje odpověď na otázku. Pokud by to fungovalo, výsledky by vzhledem k zařazené otázce měly větší relevanci než výsledky z vyhledávače klíčových slov.

Dějiny

Rozhraní prototypu Nl se již objevila na konci šedesátých a na začátku sedmdesátých let.

  • SHRDLU , rozhraní v přirozeném jazyce, které manipuluje s bloky ve virtuálním „světě bloků“
  • Lunar , přirozené jazykové rozhraní k databázi obsahující chemické analýzy měsíčních hornin Apolla-11 od Williama A. Woodse .
  • Chat-80 transformoval anglické otázky na výrazy Prolog , které byly vyhodnoceny podle databáze Prolog. Kód Chat-80 byl široce distribuován a tvořil základ několika dalších experimentálních Nl rozhraní. Na webu LPA je k dispozici online demo.
  • ELIZA , napsaná na MIT Josephem Weizenbaumem v letech 1964 až 1966, napodobovala psychoterapeuta a byla provozována zpracováním reakcí uživatelů na skripty. Skript DOCTOR využíval téměř žádné informace o lidských myšlenkách nebo emocích a někdy poskytoval překvapivě lidskou interakci. Na webu LPA je k dispozici online demo.
  • Janus je také jedním z mála systémů na podporu dočasných otázek.
  • Intelekt z Trinzic (vznikl sloučením AICorp a Aion).
  • Parlan BBN staví na zkušenostech z vývoje systémů Rus a Irus .
  • Jazykový přístup IBM
  • Otázky a odpovědi od společnosti Symantec .
  • Datatalker od společnosti Natural Language Inc.
  • Loqui od BIM Systems.
  • Anglický průvodce od Linguistic Technology Corporation .

Výzvy

Rozhraní přirozeného jazyka v minulosti vedla uživatele k antropomorfizaci počítače nebo přinejmenším k tomu, aby strojům přisoudila více inteligence, než je zaručeno. Na straně uživatele to vedlo k nerealistickým očekáváním schopností systému. Taková očekávání ztěžují osvojení si omezení systému, pokud mu uživatelé přisuzují příliš mnoho schopností, a nakonec povedou ke zklamání, když systém nepracuje tak, jak se očekávalo, jak tomu bylo v zimě AI v 70. a 80. letech.

Dokument z roku 1995 s názvem „Rozhraní přirozeného jazyka k databázím - úvod“ popisuje některé výzvy:

Modifikační nástavec
Požadavek „Seznam všech zaměstnanců ve společnosti s řidičským průkazem“ je nejednoznačný, pokud nevíte, že společnosti nemohou mít řidičské průkazy.
Spojení a rozpojení
„Seznam všech žadatelů, kteří žijí v Kalifornii a Arizoně“ je nejednoznačný, pokud nevíte, že člověk nemůže žít na dvou místech najednou.
Rozlišení anafory
vyřešte, co uživatel myslí „on“, „ona“ nebo „to“, v sebereferenčním dotazu.

Dalšími cíli, které je třeba vzít v úvahu obecněji, jsou rychlost a účinnost rozhraní, ve všech algoritmech jsou tyto dva body hlavním bodem, který určí, zda jsou některé metody lepší než jiné, a mají tedy větší úspěch na trhu. Lokalizace na více jazykových webech navíc vyžaduje zvláštní pozornost - je to založeno na odlišné struktuře vět a syntaxích jazyků mezi většinou jazyků.

Pokud jde konečně o použité metody, hlavním problémem, který je třeba vyřešit, je vytvoření obecného algoritmu, který dokáže rozpoznat celé spektrum různých hlasů, bez ohledu na národnost, pohlaví nebo věk. Významné rozdíly mezi extrahovanými funkcemi - dokonce i od řečníků, kteří říkají stejné slovo nebo frázi - musí být úspěšně překonány.

Použití a aplikace

Rozhraní v přirozeném jazyce dává vzniknout technologii používané pro mnoho různých aplikací.

Mezi hlavní použití patří:

  • Diktování je dnes nejběžnějším používáním systémů automatického rozpoznávání řeči (ASR). To zahrnuje lékařské přepisy, právní a obchodní diktáty a obecné zpracování textu. V některých případech se ke zvýšení přesnosti systému používají speciální slovníky.
  • Systémy velení a řízení , systémy ASR, které jsou navrženy k provádění funkcí a akcí v systému, jsou definovány jako systémy příkazů a řízení. Projevy jako „Open Netscape“ a „Start a new xterm“ to udělají.
  • Telefonie , některé systémy pobočkové ústředny/ hlasové pošty umožňují volajícím vyslovovat příkazy namísto odesílání konkrétních tónů stisknutím tlačítek.
  • Nositelná zařízení , protože vstupy jsou pro nositelná zařízení omezené, je mluvení přirozenou možností.
  • Lékaři, postižení , mnoho lidí má potíže s psaním kvůli fyzickým omezením, jako jsou poranění opakovaným namáháním (RSI), svalová dystrofie a mnoho dalších. Například lidé s poruchou sluchu by mohli pomocí systému připojeného k jejich telefonu převést řeč volajícího na text.
  • Vestavěné aplikace , některé nové mobilní telefony obsahují rozpoznávání řeči C&C, které umožňují výroky, jako je „volání domů“. To může být hlavní faktor v budoucnosti automatického rozpoznávání řeči a Linuxu .
  • Vývoj softwaru : Integrované vývojové prostředí může integrovat rozhraní v přirozeném jazyce, aby pomohlo vývojářům.

Níže jsou pojmenovány a definovány některé z aplikací, které používají rozpoznávání přirozeného jazyka, a proto mají výše uvedené integrované nástroje.

Všudypřítomnost

Ubiquity, doplněk pro Mozilla Firefox , je sbírka rychlých a snadných příkazů odvozených z přirozeného jazyka, které fungují jako mashup webových služeb, což uživatelům umožňuje získat informace a propojit je s aktuálními a jinými webovými stránkami.

Wolfram Alpha

Wolfram Alpha je online služba, která odpovídá na faktické dotazy přímo tím, že odpověď vypočítá ze strukturovaných dat, místo aby poskytovala seznam dokumentů nebo webových stránek, které by mohly obsahovat odpověď jako vyhledávač . To bylo oznámeno v březnu 2009 Stephen Wolfram , a byl propuštěn pro veřejnost dne 15. května 2009.

Siri

Siri je inteligentní aplikace osobního asistenta integrovaná s operačním systémem iOS . Aplikace používá zpracování přirozeného jazyka k zodpovězení otázek a doporučení.

Marketingová tvrzení Siri zahrnují, že se v průběhu času přizpůsobuje individuálním preferencím uživatele a přizpůsobuje výsledky a plní úkoly, jako je rezervace večeře při pokusu chytit taxík.

Ostatní

  • Ask.com - Původní myšlenkou Ask Jeeves (Ask.com) bylo tradiční vyhledávání podle klíčových slov se schopností získat odpovědi na otázky položené v každodenním, přirozeném jazyce. Aktuální Ask.com to stále podporuje, s přidanou podporou pro otázky z matematiky, slovníku a převodu.
  • Braina - Braina je přirozené jazykové rozhraní pro operační systém Windows, které umožňuje psát nebo vyslovovat věty v anglickém jazyce k provedení určité akce nebo vyhledání informací.
Screenshot klasického rozhraní GNOME DO.
  • GNOME Do - Umožňuje rychlé nalezení různých artefaktů prostředí GNOME (aplikace, kontakty Evolution a Pidgin, záložky Firefoxu, umělci a alba Rhythmbox a tak dále) a provádět na nich základní akce (spouštění, otevírání, e -mail, chat, přehrávání, atd.).
  • hakia - hakia byl internetový vyhledávač. Společnost vynalezla alternativní novou infrastrukturu k indexování, která používala algoritmus SemanticRank, mix řešení z oborů ontologické sémantiky, fuzzy logiky, výpočetní lingvistiky a matematiky. hakia uzavřena v roce 2014.
  • Lexxe -Lexxe byl internetový vyhledávač, který pro dotazy používal zpracování v přirozeném jazyce (sémantické vyhledávání). Hledat lze pomocí klíčových slov, frází a otázek, například „Jak stará je Wikipedie?“ Společnost Lexxe uzavřela své služby vyhledávačů v roce 2015.
  • Pikimal -Pikimal používal přirozený jazyk vázaný na preference uživatelů k vytváření doporučení pro vyhledávání podle šablony. Pikimal uzavřen v roce 2015.
  • Powerset - 11. května 2008 společnost odhalila nástroj pro vyhledávání pevné podmnožiny Wikipedie pomocí konverzačních frází místo klíčových slov. 1. července 2008 byl zakoupen společností Microsoft .
  • Q-go -Technologie Q-go poskytuje uživatelům relevantní odpovědi na dotazy na internetových stránkách nebo firemním intranetu společnosti, formulované přirozenými větami nebo podobně jako klíčová slova. Společnost Q-go získala společnost RightNow Technologies v roce 2011.
  • Yebol -Yebol byl vertikální „rozhodovací“ vyhledávač, který vyvinul sémantickou vyhledávací platformu založenou na znalostech. Algoritmy umělé inteligence inspirované umělou inteligencí společnosti Yebol automaticky seskupovaly a kategorizovaly výsledky vyhledávání, webové stránky, stránky a obsah, který prezentoval, ve vizuálně indexovaném formátu, který je více v souladu s původním lidským záměrem. Společnost Yebol používala asociační, klasifikační a klastrové algoritmy k analýze souvisejících klíčových slov nebo webových stránek. Společnost Yebol integrovala zpracování přirozeného jazyka, otevřené komplexní systémy založené na metasyntetických technologiích a strojové algoritmy s lidskými znalostmi pro vytvoření webového adresáře, který se ve skutečnosti „učí“, přičemž pomocí algoritmů korelace, klastrování a klasifikace automaticky generoval znalostní dotaz, který byl zadržen a regenerován vpřed.

Viz také

Reference