Програма хваща фалшивите коментари в мрежата

С нея ще разбираме дали отзивът за избрания хотел е истинен или е рекламен трик

по статията работи: Георги Георгиев | 26.07.2011 | 14:43

Ако сте свикнали да четете онлайн отзивите и коментарите, преди да си купите даден продукт или услуга, най-вероятно не винаги попадате на истината.

Изследвания показват, че много често сайтовете за коментари на даден клас услуги или продукти са наводнени от т.нар opinion spam – фалшиви позитивни или негативни рецензии, написани с цел реклама на дадена стока или борба с конкуренцията.
Тук лошите новини са, че хората в повечето случаи не могат да идентифицират кой коментар в мрежата отразява истината и кой чисто и просто е реклама.

Добрата новина обаче идва с изследователи от университета Корнел, които са разработили компютърен софтуер, който е доста добър в "хващането" на лъжците, информира учебното заведение.

При тест, проведен върху 800 статии за хотели в Чикаго, компютърната програма е успяла да засече лъжливите коментари с точност от почти 90%.

В процеса на разработката на софтуера ѝ учените установили интересни връзки между езиковата структура на измамните и истинни коментари в статиите.

В основата на програмата те заложили информация, получена от хора, които преднамерено пишат фалшиви позитивни коментари за 20 хотела в Чикаго. Данните били сравнени със същия брой внимателно подбрани истинни коментари.

Първата стъпка в анализа била да се дадат вкупом тези статии за тестване от жури от трима души, които не знаели коя статия е вярна и коя – грешна. Оказало се, че хората не са в състояние да отличат истинните от лъжливите рецензии.

След това учените приложили компютърен анализ върху статиите, базиран на едва доловими характеристики на текстовете. Оказало се, че авторите на истинните рецензии например по-често използвали конкретни думи, свързани с хотела като "баня" "регистрация" или "цена".

Измамниците пък пишели повече за общи понятия като "ваканция" или "бизнес пътуване".

Лъжливите и честните се различавали и по ключовите думи, засягащи човешкото поведение и личния живот. Често те използвали различни количества пунктуационни знаци, честотата на използваните гръмки изрази била различна. Като цяло лъжците наблягали повече на глаголите, а тези, които казвали истината – на съществителните.

Следващата стъпка на проекта ще бъде прилагането на техниките и в други категории рецензии като например тези на ресторанти и на различни потребителски продукти. В бъдеще внимание ще бъде обърнато и на негативните статии, като софтуерът ще бъде използван като филтър, който да извършва първоначалното отсяване лъжливите коментари.

Приложена на практика, техника би била полезна както на всички нас като клиенти, така и на продавачите и на сайтовете за коментари, които биха повишили потребителското доверие в себе си, коментират специалистите.


Добави коментар
Моля, пишете на кирилица! Коментари, написани на латиница, ще бъдат изтривани.

Коментари


3 Мариана . 26.07.2011 | 16:02
Компютърната лингвистика е много интересна и сложна наука, която последните години се развива с доста сериозни темпове. Според мен силата и е именно в разработването на подобни програми, анализиращи езика на база някаква повтаряемост на структури и пр, това е огромен обем от информация, който е възможно да бъде обработен единствено по този начин и то за толкова кратко време. Въпросът с надеждността на Google Преводач е доста по-сложен, тъй като няма как машината да отчита коректно многозначността на някои думи.
2 Павката _ 26.07.2011 | 15:06
Аз съм съгласен, защото искам да попадам на обективни и истински мнения на потребители, които са притежавали такава стока и имат мнение за нея. Обаче смятам, че програмата може и да се провали, защото не винаги ще разпознава истинските коментари. Когато "Google" ви превежда някакъв текст, търсачката не го прави перфектно и има доста несвързани думи!
1 V D 26.07.2011 | 15:04
Интересно! Дали сега ще хване моят коментар дали е лъжлив или не?! Това до колкото разбирам е разработен някакъв алгоритъм, който брои колко са глаголите и колко съществителните в даден коментар. Не всеки път обаче той може да е обективен, тъй като може само за един глагол да се окаже, че коментара ни е лъжлив и за едно съществително, че не е истина.

ТВ програма

Кино

  • Сега Денят започва сутрешен блок с...
  • 09:20 100% будни сутрешно токшоу с...
  • 11:00 Култура.БГ предаване за култура с...
  • 12:00 По света и у нас
  • 12:25 Новини на турски език
  • 12:35 Малки истории /п/
  • 12:45 Телепазарен прозорец
  • 13:00 Последният печели...
  • Сега "Тази сутрин" - сутрешен блок с...
  • 09:30 "Преди обед" - токшоу с водещи...
  • 12:00 bTV Новините - обедна емисия
  • 12:30 "Комиците и приятели" - комедийно...
  • 13:30 "Присъда" - сериал, с.2, еп.2 /п./
  • 15:00 Премиера: "Плен" - сериал, с.1,...
  • 16:00 Премиера: "Моите братя и сестри" -...
  • 17:00 bTV Новините
  • Сега "Здравей, България" - сутрешен блок
  • 09:30 "На кафе" - предаване на NOVA
  • 12:00 Новините на NOVA
  • 12:30 "Наследство" (премиера) - сериен...
  • 13:30 "Свободна да избира" (премиера) -...
  • 15:00 "Лабиринт към щастието" (премиера)...
  • 16:00 Новините на NOVA
  • 16:10 "Пресечна точка" - публицистично шоу
Какво е общото между цигарите и мазнините по корема Анализът им показва, че започването на пушенето и пушенето през целия живот е свързано с увеличаване на коремните мазнини.