Ново разбиране за търсенето на текст




Ново разбиране за търсенето на текст

PCMagazine, Брой 7
Категория: Бази данни , Интернет
Етикети: Интернет , бази данни , търсачки , eTBLAST
PC MAGAZINE
15.7.2008

Ново разбиране за търсенето на текст

Нов академичен инструмент вещае революция при търсенето на текст.

Подобно на досаден студент, който излива цяла пълноводна река от факти, когато професорът иска отговор с една дума, много търсачки предлагат много повече отговори, отколкото искат потребителите. Сега изследователите от Югозападния медицински център на Университета на Тексас твърдят, че търсенията по ключова дума вероятно са на път да останат в историята – поне за учените.

Инструментът за търсене eTBLAST сканира документи за откриване на подобия на текст, вместо да сравнява ключови думи; това дава възможност на потребителя да въведе като заявка цял абзац – например извадка или описание на откритие. В зависимост от подредбата на думите, честотата на употребата им и близостта им eTBLAST извежда списък на документите и им дава оценка за подобност. Г-н Харолд Гарнър от Югозападния медицински център на Университета на Тексас, който помогна за разработка на кода, каза, че целта на екипа е да издаде актуализирана версия на eTBLAST, която би връщала резултати в рамките на няколко секунди до няколко минути.

Гарнър добави, че eTBLAST може да проверява за преписвачи. Ако въведете откъс от научното издание, системата може да търси точно негово съответствие. В резултат на няколкото съмнително подобни страници, открити чрез eTBLAST, вече са започнали най-малко четири разследвания за плагиатство. Ограничените възможности на тази технология обаче водят до това, че повечето университети ще използват изпитани на практика инструменти, като Turnitin или SafeAssignment. Последният сравнява ръкопис с данни от по-широк архив в интернет.

Засега новата търсачка търси само в бази от данни от областта на медицината, физиката и на американското патентно ведомство. Но Гарнър прогнозира, че в бъдеще тя ще бъде разширена в областта на законодателството,бизнеса и др. Той постоянно търси нови и нови бази от данни. „Всяка публично достъпна и безплатна база от данни на компютърна наука – просто ни я покажете и ние с удоволствие ще я включим“, каза той. – Алисън Лап

За да опитате как работи eTBLAST при търсене на текст, посетете адрес invention.swmed.edu/etblast/etblast.shtml.

ВСИЧКО Е В КОНТЕКСТА
Новата търсачка на текст eTBLAST търси подобия в текста, а не ключови думи. Затова тя е по-ефективна при намирането на идентично съответствие на големи откъси текст.

НАЙ-ЛОШИ НАИМЕНОВАНИЯ НА ПРОДУКТИ
Предлагаме ви малко брейнсторминг, който по-добре да си бе останал зад вратите на конферентната зала.
Tonium Pacemaker - Джобна система за дисководещи
Email Stripper - Безплатен софтуер за прочистване на електронна поща
LappyMats - Защитни покрития за екрани на лаптопи
Popuload - RSS четец за новини
Zecurion Zlock 1.3 - Защитен софтуер за мрежи, работещи с Vista
Emoze - Безплатен софтуер за препращане на електронна поща

Съдържание: