Analýza sentimentu - Sentiment analysis

Analýza sentimentu (také známá jako dolování názorů nebo emoce AI ) je využití zpracování přirozeného jazyka , textové analýzy , výpočetní lingvistiky a biometrie k systematické identifikaci, extrahování, kvantifikaci a studiu afektivních stavů a ​​subjektivních informací. Analýza sentimentu je široce aplikována na materiály zákazníků, jako jsou recenze a odpovědi na průzkumy, online a sociální média a zdravotnické materiály pro aplikace, které sahají od marketingu přes zákaznický servis až po klinickou medicínu.

Příklady

Cíl a výzvy analýzy sentimentu lze ukázat na několika jednoduchých příkladech.

Jednoduché případy

  • Coronet má nejlepší řady celodenních křižníků.
  • Bertram má hluboký trup do V a snadno prochází mořem.
  • Pastelově zbarvené křižníky z 80. let z Floridy jsou ošklivé.
  • Nemám rád staré kajutové lodě .

Náročnější příklady

  • Nemám rád kabinové křižníky. ( Zpracování negace )
  • Nemít rád vodní skútry není moje věc. (Negace, obrácené pořadí slov )
  • Někdy opravdu nesnáším RIB . ( Příslovečné mění sentiment)
  • V tomhle počasí bych opravdu rád chodil ven! (Možná sarkasticky )
  • Chris Craft vypadá lépe než Limestone. (Dvě značky , určit cíl přístupu je obtížné).
  • Chris Craft vypadá lépe než Limestone, ale Limestone projektuje plavbu po moři a spolehlivost. (Dva postoje, dvě obchodní značky).
  • Film je překvapivý se spoustou znepokojivých dějových zvratů. (Negativní termín používaný v určitých oblastech v pozitivním smyslu).
  • Měli byste vidět jejich dekadentní dezertní nabídku. (Postojový výraz v některých doménách v poslední době posunul polaritu)
  • Miluji svůj mobil, ale nedoporučoval bych ho žádnému z mých kolegů. (Kvalifikovaný pozitivní sentiment, obtížná kategorizace)
  • Koncert příští týden bude správný koide9! („Quoi de neuf?“, Francouzsky „co je nového?“. Nově ražené termíny mohou být velmi postojové, ale nestálé v polaritě a často mimo známou slovní zásobu.)

Typy

Základním úkolem v analýze sentimentu je klasifikovat polaritu daného textu na úrovni dokumentu, věty nebo rysu/aspektu - ať už je vyjádřený názor v dokumentu, větě nebo rysu/aspektu entity pozitivní, negativní nebo neutrální. Pokročilá klasifikace sentimentu „mimo polaritu“ se zaměřuje například na emocionální stavy, jako je požitek, hněv, znechucení, smutek, strach a překvapení.

Mezi prekurzory sentimentální analýzy patří General Inquirer, který poskytl rady ke kvantifikaci vzorců v textu a samostatně psychologický výzkum, který zkoumal psychologický stav člověka na základě analýzy jeho verbálního chování.

Následně se metoda popsaná v patentu Volcaniho a Fogela zaměřila konkrétně na sentiment a identifikovala jednotlivá slova a fráze v textu s ohledem na různá emocionální měřítka. Současný systém založený na jejich práci, nazvaný EffectCheck, představuje synonyma, která lze použít ke zvýšení nebo snížení úrovně vyvolaných emocí v každé škále.

Mnoho dalších následných snah bylo méně sofistikovaných, s pouhým polárním pohledem na sentiment, od pozitivního po negativní, jako například práce Turneyho a Panga, kteří aplikovali různé metody pro detekci polarity recenzí produktů a recenzí filmů. Tato práce je na úrovni dokumentu. Lze také klasifikovat polaritu dokumentu ve vícecestném měřítku, o což se pokusili mimo jiné Pang a Snyder: Pang a Lee rozšířili základní úkol klasifikace filmové recenze buď jako pozitivní, nebo negativní, aby bylo možné předpovědět hodnocení hvězd buď na 3. nebo na 4hvězdičkovém měřítku, zatímco Snyder provedl hloubkovou analýzu recenzí restaurací a předpovídal hodnocení pro různé aspekty dané restaurace, jako je jídlo a atmosféra (v pětihvězdičkovém měřítku).

První kroky ke spojení různých přístupů-učení, lexikální, založené na znalostech atd. -byly podniknuty na jarním sympoziu AAAI 2004, kde lingvisté, počítačoví vědci a další zainteresovaní vědci nejprve sladili zájmy a navrhli sdílené úkoly a srovnávací soubory dat pro systematický výpočetní výzkum afektu, přitažlivosti, subjektivity a sentimentu v textu.

I když ve většině metod statistické klasifikace je neutrální třída ignorována za předpokladu, že neutrální texty leží blízko hranice binárního klasifikátoru, několik výzkumníků naznačuje, že stejně jako v každém problému s polaritou musí být identifikovány tři kategorie. Kromě toho lze dokázat, že specifické klasifikátory, jako jsou Max Entropy a SVM, mohou těžit ze zavedení neutrální třídy a zlepšit celkovou přesnost klasifikace. V zásadě existují dva způsoby provozu s neutrální třídou. Algoritmus buď pokračuje tak, že nejprve identifikuje neutrální jazyk, odfiltruje jej a poté vyhodnotí zbytek z hlediska pozitivních a negativních pocitů, nebo vytvoří třícestnou klasifikaci v jednom kroku. Tento druhý přístup často zahrnuje odhad rozdělení pravděpodobnosti ve všech kategoriích (např. Naivní Bayesovy klasifikátory implementované NLTK ). Zda a jak použít neutrální třídu, závisí na povaze dat: pokud jsou data jasně seskupena do neutrálního, negativního a pozitivního jazyka, má smysl filtrovat neutrální jazyk a zaměřit se na polaritu mezi pozitivním a negativním sentimentem. Pokud jsou naopak data většinou neutrální s malými odchylkami vůči pozitivnímu a negativnímu vlivu, tato strategie by ztížila jasné rozlišení těchto dvou pólů.

Odlišnou metodou pro určování sentimentu je použití škálovacího systému, kde slovům běžně spojeným s negativním, neutrálním nebo pozitivním sentimentem je přiřazeno přidružené číslo na stupnici −10 až +10 (nejnegativnější až nejpozitivnější) nebo jednoduše od 0 do kladné horní hranice, jako je +4. To umožňuje upravit sentiment daného termínu vzhledem k jeho prostředí (obvykle na úrovni věty). Když je kus nestrukturovaného textu analyzován pomocí zpracování přirozeného jazyka , každému konceptu v uvedeném prostředí je přiděleno skóre na základě toho, jak se sentimentová slova vztahují k konceptu a jeho přidruženému skóre. To umožňuje pohyb k sofistikovanějšímu chápání sentimentu, protože nyní je možné upravit hodnotu sentimentu konceptu vzhledem k úpravám, které jej mohou obklopovat. Slova, která například zesilují, uvolňují nebo negují sentiment vyjádřený konceptem, mohou ovlivnit jeho skóre. Alternativně může být textům přiděleno pozitivní a negativní skóre síly sentimentu, pokud je cílem určit sentiment v textu, nikoli celkovou polaritu a sílu textu.

Existují různé další typy analýzy sentimentu, jako je analýza sentimentu založená na aspektech, analýza sentimentu (pozitivní, negativní, neutrální), vícejazyčná analýza sentimentu a detekce emocí.

Identifikace subjektivity/objektivity

Tento úkol je obvykle definován jako zařazení daného textu (obvykle věty) do jedné ze dvou tříd: objektivní nebo subjektivní. Tento problém může být někdy obtížnější než klasifikace polarity. Subjektivita slov a frází může záviset na jejich kontextu a objektivní dokument může obsahovat subjektivní věty (např. Zpravodajský článek citující názory lidí). Navíc, jak uvádí Su, výsledky jsou do značné míry závislé na definici subjektivity použité při anotování textů. Pang však ukázal, že odstranění objektivních vět z dokumentu před klasifikací jeho polarity pomohlo zlepšit výkon.

Subjektivní a objektivní identifikace, objevující se dílčí úkoly analýzy sentimentu s využitím syntaktických, sémantických rysů a znalostí strojového učení k identifikaci věty nebo dokumentu jsou fakta nebo názory. Povědomí o rozpoznávání faktů a názorů není nedávné, možná je poprvé představil Carbonell na univerzitě v Yale v roce 1979.

Termín cíl označuje faktické informace o incidentu.

  • Příklad objektivní věty: „Aby byl kandidát zvolen prezidentem USA, musí mu být alespoň pětatřicet let.“

Termín subjektivní popisuje incident, který obsahuje faktografické informace v různých formách, jako jsou osobní názory, úsudek a předpovědi. Také známý jako „soukromé státy“ zmiňovaný Quirkem a kol. V níže uvedeném příkladu to odráží soukromé státy „My Američané“. Cílová entita komentovaná stanovisky navíc může mít několik podob od hmotného produktu po nehmotná témata uvedená v Liu (2010). Liu (2010) dále pozoroval tři typy postojů, 1) pozitivní názory, 2) neutrální názory a 3) negativní názory.

  • Příklad subjektivní věty: „My Američané musíme zvolit prezidenta, který je zralý a který je schopen rozumně se rozhodovat.“

Tato analýza je problémem klasifikace.

Kolekce indikátorů slov nebo frází každé třídy jsou definovány pro vyhledání požadovaných vzorů v textu bez poznámek. Pro subjektivní vyjádření byl vytvořen jiný seznam slov. Seznamy subjektivních ukazatelů ve slovech nebo frázích byly vyvinuty několika výzkumníky v oblasti zpracování jazyků a zpracování přirozeného jazyka v Riloff et al. (2003). Pro měření daných výrazů je třeba vytvořit slovník pravidel extrakce. V průběhu let, v subjektivní detekci, postup extrakce funkcí od kurátorských funkcí rukama v roce 1999 k automatizovanému učení funkcí v roce 2005. V současné době se automatizované metody učení mohou dále rozdělit na strojové učení pod dohledem a bez dozoru . Akademičtí výzkumníci rozsáhle zkoumali extrakci vzorů s anotovaným a anotovaným textem v procesu strojového učení.

Vědci však uznali několik výzev při vývoji pevných sad pravidel pro výrazy s úctou. Většina výzev při vývoji pravidel pramení z povahy textových informací. Několik badatelů rozpoznalo šest výzev: 1) metaforické výrazy, 2) nesrovnalosti ve spisech, 3) kontextové, 4) reprezentovaná slova s ​​menším počtem použití, 5) časově citlivá a 6) stále rostoucí objem.

  1. Metaforické výrazy. Text obsahuje metaforický výraz, který může mít vliv na výkon při extrakci. Kromě toho mají metafory různé formy, což může přispět ke zvýšení detekce.
  2. Nesrovnalosti ve spisech. U textu získaného z internetu zahrnují nesrovnalosti ve stylu psaní cílených textových dat odlišné žánry a styly psaní
  3. Citlivý na kontext. Klasifikace se může lišit podle subjektivity nebo objektivity předchozích a následujících vět.
  4. Časově citlivý atribut. Úkol je zpochybněn časově citlivým atributem některých textových dat. Pokud chce skupina výzkumníků potvrdit ve zprávách kus skutečnosti, potřebují delší dobu na křížovou validaci, než se zprávy stanou zastaralými.
  5. Cue slova s ​​menším počtem použití.
  6. Stále rostoucí objem. Úkol je také zpochybňován samotným množstvím textových dat. Neustále rostoucí povaha textových dat znesnadňuje výzkumníkům úkol dokončit úkol včas.

Dříve se výzkum zaměřoval především na klasifikaci na úrovni dokumentu. Klasifikace úrovně dokumentu však trpí menší přesností, protože článek může obsahovat různé typy výrazů. Výzkumné důkazy naznačují soubor zpravodajských článků, u nichž se očekává, že budou dominovat objektivním výrazem, zatímco výsledky ukazují, že obsahoval více než 40% subjektivního výrazu.

Aby vědci překonali tyto výzvy, dospěli k závěru, že účinnost klasifikátoru závisí na přesnosti učitele vzorů. A žák se živí velkým objemem komentovaných tréninkových dat překonal ty, kteří byli vyškoleni v méně komplexních subjektivních funkcích. Jednou z hlavních překážek provádění tohoto typu práce je však ruční generování velkého datového souboru komentovaných vět. Metoda ruční anotace byla méně oblíbená než automatické učení ze tří důvodů:

  1. Variace v porozumění. V úkolu ruční anotace může mezi anotátory dojít k neshodě, zda je jedna instance subjektivní nebo objektivní, kvůli nejednoznačnosti jazyků.
  2. Lidské chyby. Úkol manuální anotace je pečlivý úkol, k dokončení vyžaduje intenzivní soustředění.
  3. Časově náročné. Ruční anotační úkol je vytrvalá práce. Riloff (1996) ukazuje, že 160 textů stálo 8 hodin, než jeden anotátor dokončil.

Všechny tyto zmíněné důvody mohou mít dopad na účinnost a účinnost subjektivní a objektivní klasifikace. V souladu s tím byly navrženy dvě metody bootstrapování pro učení lingvistických vzorů z anotovaných textových dat. Obě metody začínají hrstkou úvodních slov a textových dat bez poznámek.

  1. Meta-Bootstrapping od Riloffa a Jonese v roce 1999. Úroveň první: Generujte extrakční vzorce na základě předem definovaných pravidel a extrahovaných vzorů podle počtu počátečních slov, která každý vzor obsahuje. Leve Two: 5 nejlepších slov bude označeno a přidáno do slovníku. Opakovat.
  2. Basilisk ( B ootstrapping A pproach to S emantic L exicon I nduction using S emantic K nowledge ) Thelen and Riloff. Krok první: Generování vzorců extrakce Krok dva: Přesun nejlepších vzorů z fondu vzorů do fondu kandidátských slov. Krok tři: Prvních 10 slov bude označeno a přidáno do slovníku. Opakovat.

Celkově tyto algoritmy zdůrazňují potřebu automatického rozpoznávání a extrakce vzorů v subjektivních a objektivních úkolech.

Subjektivní a objektový klasifikátor může zlepšit obslužné aplikace zpracování přirozeného jazyka. Jednou z hlavních výhod klasifikátoru je, že popularizoval praxi rozhodovacích procesů založených na datech v různých průmyslových odvětvích. Podle Liu byly aplikace subjektivní a objektivní identifikace implementovány do obchodu, reklamy, sportu a sociálních věd.

  • Klasifikace online recenzí: V podnikatelském odvětví pomáhá klasifikátor společnosti lépe porozumět zpětné vazbě na produkt a důvodům, které za recenzemi stojí.
  • Predikce ceny akcií: Ve finančním odvětví pomáhá classier predikčnímu modelu zpracováním pomocných informací ze sociálních médií a dalších textových informací z internetu. Předchozí studie cen japonských akcií provedené společností Dong et.al. označuje, že model se subjektivním a objektivním modulem může fungovat lépe než modely bez této části.
  • Analýza sociálních médií.
  • Klasifikace zpětné vazby studentů.
  • Shrnutí dokumentu: Klasifikátor může extrahovat komentáře specifické pro cíl a shromažďovat názory od jednoho konkrétního subjektu.
  • Odpověď na složitou otázku. Klasifikátor může složité otázky pitvat zařazením jazykového předmětu nebo objektivního a soustředěného cíle. Ve výzkumu Yu a kol. (2003) výzkumník vyvinul větu a dokument na úrovni seskupených kusů identity.
  • Aplikace specifické pro doménu.
  • Analýza e -mailu: Subjektivní a objektivní klasifikátor detekuje spam sledováním jazykových vzorů pomocí cílových slov.

Funkce/aspekt

Vztahuje se k určování názorů nebo pocitů vyjádřených na různé vlastnosti nebo aspekty entit, např. Na mobilní telefon, digitální fotoaparát nebo banku. Funkce nebo aspekt je atribut nebo součást entity, např. Obrazovka mobilního telefonu, služba pro restauraci nebo kvalita obrazu fotoaparátu. Výhodou analýzy sentimentu na základě funkcí je možnost zachytit nuance o objektech, které nás zajímají. Různé funkce mohou generovat různé reakce sentimentu, například hotel může mít výhodnou polohu, ale průměrné jídlo. Tento problém zahrnuje několik dílčích problémů, např. Identifikaci relevantních entit, extrakci jejich vlastností/aspektů a určení, zda je názor vyjádřený na každý rys/aspekt pozitivní, negativní nebo neutrální. Automatickou identifikaci funkcí lze provádět syntaktickými metodami, modelováním témat nebo hlubokým učením . Podrobnější diskuse o této úrovni analýzy sentimentu lze nalézt v Liuově práci.

Metody a funkce

Stávající přístupy k analýze sentimentu lze seskupit do tří hlavních kategorií: techniky založené na znalostech, statistické metody a hybridní přístupy. Techniky založené na znalostech klasifikují text podle kategorií afektů na základě přítomnosti jednoznačných afektivních slov, jako je radost, smutek, strach a nuda. Některé znalostní báze nejenže uvádějí zjevná afektivní slova, ale také přiřazují libovolným slovům pravděpodobnou „afinitu“ ke konkrétním emocím. Statistické metody využívají prvky ze strojového učení, jako je latentní sémantická analýza , podpůrné vektorové stroje , „ pytel slov “, „ Pointwise Mutual Information “ pro sémantickou orientaci a hluboké učení . Sofistikovanější metody se pokoušejí detekovat držitele sentimentu (tj. Osobu, která si udržuje tento afektivní stav) a cíl (tj. Entitu, ve které je cítit afekt). K těžbě názoru v kontextu a získání funkce, ke které se mluvčí vyjádřil, se používají gramatické vztahy slov. Gramatické relační vztahy jsou získány hlubokým rozebráním textu. Hybridní přístupy využívají jak strojové učení, tak prvky z reprezentace znalostí, jako jsou ontologie a sémantické sítě, za účelem detekce sémantik, které jsou vyjádřeny subtilním způsobem, např. Prostřednictvím analýzy konceptů, které explicitně neposkytují relevantní informace, ale které jsou implicitně propojeny na jiné koncepty, které tak činí.

Softwarové nástroje s otevřeným zdrojovým kódem a řada bezplatných a placených nástrojů pro analýzu sentimentu nasazují strojové učení , statistiky a techniky zpracování přirozeného jazyka k automatizaci analýzy sentimentu u velkých sbírek textů, včetně webových stránek, online zpráv, internetových diskusních skupin, online recenzí, webové blogy a sociální média. Znalostní systémy na druhé straně využívají veřejně dostupné zdroje k extrakci sémantických a afektivních informací spojených s pojmy přirozeného jazyka. Systém může pomoci provádět afektivní rozumové uvažování . Analýzu citů lze provádět také u vizuálního obsahu, tj. Obrázků a videí (viz Multimodální analýza sentimentu ). Jedním z prvních přístupů v tomto směru je SentiBank využívající reprezentaci vizuálního obsahu ve dvojici přídavných jmen. Drtivá většina přístupů ke klasifikaci sentimentu navíc spoléhá na model pytel slov, který nebere v úvahu kontext, gramatiku a dokonce ani slovosled . Přístupy, které analyzují sentiment na základě toho, jak slova vytvářejí význam delších frází, ukázaly lepší výsledky, ale způsobují dodatečnou režii anotací.

Při analýze sentimentu je vyžadována složka lidské analýzy, protože automatizované systémy nejsou schopny analyzovat historické tendence jednotlivých komentátorů nebo platformy a jsou často nesprávně klasifikovány v jejich vyjádřeném sentimentu. Automatizace ovlivňuje přibližně 23% komentářů, které jsou správně klasifikovány lidmi. Lidé však často nesouhlasí a tvrdí se, že mezilidská dohoda poskytuje horní hranici, které mohou klasifikátory automatizovaného sentimentu nakonec dosáhnout.

Vyhodnocení

Přesnost systému analýzy sentimentu je v zásadě v tom, do jaké míry odpovídá lidským úsudkům. To se obvykle měří variantními opatřeními založenými na přesnosti a odvolání přes dvě cílové kategorie negativních a pozitivních textů. Podle výzkumu se však lidští hodnotitelé obvykle shodnou pouze na 80% času (viz spolehlivost hodnotitele ). Program, který dosahuje 70% přesnosti při klasifikaci sentimentu, si vede téměř stejně dobře jako člověk, přestože taková přesnost nemusí znít působivě. Pokud by byl program 100% „správný“, lidé by s ním asi ve 20% případů stále nesouhlasili, protože s jakoukoli odpovědí tolik nesouhlasí .

Na druhou stranu počítačové systémy budou dělat velmi odlišné chyby než lidské hodnotitelé, a proto čísla nejsou zcela srovnatelná. Například počítačový systém bude mít potíže s negacemi, nadsázkami, vtipy nebo sarkasmem, které jsou pro lidského čtenáře obvykle snadno zvládnutelné: některé chyby, které počítačový systém dělá, budou člověku připadat příliš naivní. Obecně byla zpochybněna užitečnost praktických komerčních úkolů analýzy sentimentu, jak je definována v akademickém výzkumu, většinou proto, že jednoduchý jednorozměrný model sentimentu od negativního k pozitivnímu přináší poměrně málo akčních informací pro klienta, který se obává účinek veřejného diskurzu např. na pověst značky nebo společnosti.

Aby se lépe přizpůsobily potřebám trhu, hodnocení analýzy sentimentu přešlo na více opatření založených na úkolech, formulovaných společně se zástupci PR agentur a odborníky na průzkum trhu. Například v souboru hodnotících dat RepLab je kladen menší důraz na obsah uvažovaného textu a více na vliv dotyčného textu na pověst značky .

Protože vyhodnocení analýzy sentimentu je stále více založeno na úkolech, každá implementace potřebuje samostatný tréninkový model, aby získala přesnější reprezentaci sentimentu pro danou datovou sadu.

Web 2.0

Vzestup sociálních médií, jako jsou blogy a sociální sítě , vyvolal zájem o analýzu sentimentu. S rozšířením recenzí, hodnocení, doporučení a dalších forem online vyjadřování se online mínění změnilo v druh virtuální měny pro podniky, které chtějí prodávat své produkty, identifikovat nové příležitosti a spravovat svou pověst. Vzhledem k tomu, že se podniky snaží automatizovat proces odfiltrování hluku, porozumění konverzacím, identifikaci relevantního obsahu a vhodné akce, mnoho z nich nyní hledá oblast analýzy sentimentu. Dále to komplikuje vzestup anonymních platforem sociálních médií, jako jsou 4chan a Reddit . Pokud web 2.0 znamenal demokratizaci publikování, pak další fáze webu může být založena na demokratizaci dolování dat veškerého publikovaného obsahu.

Jeden krok k tomuto cíli je dosažen ve výzkumu. Několik výzkumných týmů na univerzitách po celém světě se v současné době zaměřuje na pochopení dynamiky sentimentu v e-komunitách prostřednictvím analýzy sentimentu. Projekt CyberEmotions například nedávno vyzdvihla úlohu negativních emocí při řízení sociálních sítí diskusí.

Problém je v tom, že většina algoritmů pro analýzu sentimentu používá k vyjádření sentimentu ohledně produktu nebo služby jednoduché výrazy. Kulturní faktory, jazykové nuance a různé kontexty však ztěžují přeměnu řetězce psaného textu na jednoduché pro nebo sentiment. Skutečnost, že lidé často nesouhlasí s názorem na text, ukazuje, jak velkým úkolem je, aby to počítače správně zvládly. Čím je textový řetězec kratší, tím je těžší.

Přestože krátké textové řetězce mohou být problémem, analýza sentimentu v rámci mikroblogování ukázala, že Twitter lze považovat za platný online indikátor politického cítění. Politický sentiment tweetů ukazuje těsnou korespondenci s politickými postoji stran a politiků, což naznačuje, že obsah zpráv na Twitteru věrohodně odráží offline politické prostředí. Kromě toho bylo také ukázáno, že analýza sentimentu na Twitteru zachycuje náladu veřejnosti za cykly lidské reprodukce na celém světě, stejně jako další problémy související s veřejným zdravím, jako jsou nežádoucí reakce na léky.

Zatímco analýza sentimentu je populární v doménách, kde autoři vyjadřují svůj názor spíše explicitně („film je úžasný“), jako jsou sociální média a recenze produktů, teprve nedávno byly vyvinuty robustní metody pro jiné domény, kde je sentiment silně implicitní nebo nepřímý. Například ve zpravodajských článcích - většinou kvůli očekávané novinářské objektivitě - novináři často popisují akce nebo události spíše než přímo uvádějí polaritu určité informace. Dřívější přístupy využívající slovníky nebo mělké funkce strojového učení trpěly tím, že nedokázaly zachytit „význam mezi řádky“, ale v poslední době vědci navrhli přístup založený na hlubokém učení a datovou sadu, aby bylo možné analyzovat sentiment ve zpravodajských článcích.

Aplikace v doporučovacích systémech

U systému doporučovatelů se analýza sentimentu ukázala jako cenná technika. Systém doporučení má za cíl předpovědět preferenci položky cílového uživatele. Systémy hlavního proudu doporučení fungují na explicitní sadě dat. Například kolaborativní filtrování funguje na matici hodnocení a filtrování podle obsahu funguje na metadatech položek.

V mnoha službách sociálních sítí nebo na webových stránkách elektronického obchodování mohou uživatelé k položkám poskytnout textovou recenzi, komentář nebo zpětnou vazbu. Tyto texty generované uživateli poskytují bohatý zdroj názorů uživatelů na řadu produktů a položek. U položky může takový text potenciálně odhalit jak související vlastnosti/aspekty položky, tak i pocity uživatelů z každé funkce. Funkce/aspekty položky popsané v textu hrají stejnou roli s metadaty při filtrování podle obsahu , ale ty první jsou pro systém doporučovatelů cennější. Vzhledem k tomu, že tyto funkce uživatelé ve svých recenzích široce zmiňují, lze je považovat za nejdůležitější funkce, které mohou výrazně ovlivnit uživatelský zážitek s položkou, zatímco metadata položky (obvykle poskytovaná výrobci místo spotřebitelů) může ignorovat funkce, kterých se uživatelé týkají. U různých položek se společnými funkcemi může uživatel vyjádřit různé nálady. Také funkce stejné položky může přijímat různé nálady od různých uživatelů. Sentiment uživatelů k funkcím lze považovat za vícerozměrné skóre hodnocení, které odráží jejich preference k položkám.

Na základě funkce/aspektů a citů extrahovaných z textu generovaného uživateli lze zkonstruovat hybridní systém doporučení. Existují dva druhy motivace doporučit kandidátskou položku uživateli. První motivací je, že kandidátský předmět má mnoho společných rysů s preferovanými položkami uživatele, zatímco druhým motivem je, že kandidátský předmět získává na jeho vlastnostech vysoký sentiment. U upřednostňované položky je rozumné se domnívat, že položky se stejnými funkcemi budou mít podobnou funkci nebo nástroj. Takže tyto položky budou pravděpodobně také upřednostňovány uživatelem. Na druhou stranu, pokud jde o sdílenou funkci dvou kandidátských položek, ostatní uživatelé mohou dát jednomu z nich pozitivní sentiment, zatímco jinému dávají negativní sentiment. Je jasné, že vysoce hodnocená položka by měla být uživateli doporučena. Na základě těchto dvou motivací lze pro každou kandidátskou položku sestavit kombinované hodnocení podobnosti a hodnocení sentimentu.

Až na obtížnost samotné analýzy sentimentu, aplikace analýzy sentimentu na recenze nebo zpětnou vazbu také čelí výzvě spamu a neobjektivních recenzí. Jeden směr práce je zaměřen na hodnocení užitečnosti každé recenze. Špatně napsaná recenze nebo zpětná vazba je pro systém doporučovatelů stěží užitečná. Kromě toho může být recenze navržena tak, aby bránila prodeji cílového produktu, a tak byla škodlivá pro systém doporučení, i když je dobře napsaná.

Výzkumníci také zjistili, že s dlouhými a krátkými formami textu generovaného uživateli by se mělo zacházet odlišně. Zajímavý výsledek ukazuje, že recenze v krátkém formátu jsou někdy užitečnější než v dlouhém formátu, protože je snazší filtrovat šum v textu v krátkém formátu. U textu v dlouhé formě nepřináší rostoucí délka textu vždy úměrné zvýšení počtu rysů nebo sentimentů v textu.

Lamba & Madhusudhan představují rodící se způsob, jak uspokojit informační potřeby dnešních uživatelů knihoven tím, že přebalí výsledky z analýzy sentimentu platforem sociálních médií, jako je Twitter, a poskytnou ji jako konsolidovanou časově založenou službu v různých formátech. Dále navrhují nový způsob vedení marketingu v knihovnách pomocí dolování sociálních médií a analýzy sentimentu.

Viz také

Reference