Дали транскрипцијата со ВИ на разговорите со пациентите прави грешки?

OpenAI го претстави Whisper пред две години како ВИ алатка што го транскрибира говорот во текст. Сега, алатката ја користи ВИ здравствената компанија Nabla и нејзините 45 000 клинички лекари за да помогнат во транскрипцијата на медицинските разговори во повеќе од 85 организации, како што е Универзитетот во Ајова „Health Care“.

razgovori-so-pacienti-2375-fi

Извор: Pexels

Меѓутоа, новите истражувања покажуваат дека Whisper „измислува“, односно додава реченици во транскрипциите што никој не ги изговорил. Затоа се поставува прашањето: Колку брзо медицинските установи треба да ја прифатат вештачката интелигенција (ВИ) ако таа прави грешки.

Според Associated Press, истражувач од Универзитетот во Мичиген открил „халуцинации“ во 80% од транскрипциите на Whisper. Неименуван програмер ги забележал во половина од повеќе од 100 часа транскрипција. Друг инженер нашол неточности во речиси сите од 26 000 транскрипции направени со помош на Whisper, пишува Entrepreneur.

Последици за пациентите

Погрешните транскрипции на разговорите меѓу лекарите и пациентите може да имаат „навистина сериозни последици“, изјави Алондра Нелсон, професорка на Институтот за напредни студии во Принстон.

„Никој не сака погрешна дијагноза“, изјави Нелсон.

Оваа година, истражувачи од Универзитетот Корнел, Универзитетот во Њујорк, Универзитетот Вашингтон и Универзитетот Вирџинија објавија студија во која се следело колку пати услугата за претворање говор во текст Whisper на OpenAI „халуцинирала“ додека транскрибирала 13 140 аудио снимки со просечно времетраење од 10 секунди. Звукот бил преземен од базата на податоци AphasiaBank на TalkBank, која содржи гласови на луѓе со афазија, нарушување на говорот кое ја отежнува комуникацијата.

Кога го спровеле експериментот во пролетта 2023 година, истражувачите откриле 312 случаи на „халуцинирани фрази или реченици, кои не постоеле во никаков облик во основниот звук“.

razgovori-so-pacienti-2375-ps1

Извор: Freepik

Говор на омраза и неточности

Меѓу „халуцинираните“ транскрипции, 38% содржеле говор на омраза, насилство или стереотипи што не одговарале на контекстот на разговорот.

„Нашето истражување покажува дека постои сериозна загриженост за неточноста на Whisper поради непредвидливите халуцинации“, напишале истражувачите.

Тие велат дека студијата може да укаже и на пристрасност во работата на Whisper или на тенденција да внесува неточности за одредена група, а не само за луѓе со афазија.

„Врз основа на нашите наоди, предлагаме дека ваква пристрасност може да се појави и за која било демографска група со нарушувања во говорот што доведуваат до поголема нејасност, односно пелтечење“, наведоа истражувачите.

Извор: Bizlife.rs

Избор на уредникот

Prijavi se na novosti.