лингвистические принципы построения тезауруса. Тезаурусы

, антонимы , паронимы , гипонимы , гиперонимы и т. п.) между лексическими единицами. Тезаурусы являются одним из действенных инструментов для описания отдельных предметных областей.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.

В психологии тезаурус индивидуума характеризуют восприятие и понимание информации. Теория коммуникации также рассматривает общий тезаурус сложной системы, благодаря которому взаимодействуют её элементы .

История

Одним из первых тезаурусов называют «Словарь синонимов» Филона Библского . Более точное соответствие термину имеет Амара-коша , написанный на санскрите в стихотворной форме в VI веке. Первый современный английский тезаурус был создан Питером Марком Роже (англ.) в 1805 году. Он был опубликован в 1852 году и с тех пор используется без переизданий .

В 1970-е годы тезаурусы стали активно использоваться для информационно-поисковых задач. В таких тезаурусах слова сопоставляются с дескрипторами, через которые устанавливаются семантические связи .

Тезаурусы

См. также

Напишите отзыв о статье "Тезаурус"

Примечания

Отрывок, характеризующий Тезаурус

– Каким ты щеголем нынче! – оглядывая его новый ментик и вальтрап, сказал Несвицкий.
Денисов улыбнулся, достал из ташки платок, распространявший запах духов, и сунул в нос Несвицкому.
– Нельзя, в дело иду! выбг"ился, зубы вычистил и надушился.
Осанистая фигура Несвицкого, сопровождаемая казаком, и решительность Денисова, махавшего саблей и отчаянно кричавшего, подействовали так, что они протискались на ту сторону моста и остановили пехоту. Несвицкий нашел у выезда полковника, которому ему надо было передать приказание, и, исполнив свое поручение, поехал назад.
Расчистив дорогу, Денисов остановился у входа на мост. Небрежно сдерживая рвавшегося к своим и бившего ногой жеребца, он смотрел на двигавшийся ему навстречу эскадрон.
По доскам моста раздались прозрачные звуки копыт, как будто скакало несколько лошадей, и эскадрон, с офицерами впереди по четыре человека в ряд, растянулся по мосту и стал выходить на ту сторону.
Остановленные пехотные солдаты, толпясь в растоптанной у моста грязи, с тем особенным недоброжелательным чувством отчужденности и насмешки, с каким встречаются обыкновенно различные роды войск, смотрели на чистых, щеголеватых гусар, стройно проходивших мимо их.
– Нарядные ребята! Только бы на Подновинское!
– Что от них проку! Только напоказ и водят! – говорил другой.
– Пехота, не пыли! – шутил гусар, под которым лошадь, заиграв, брызнула грязью в пехотинца.
– Прогонял бы тебя с ранцем перехода два, шнурки то бы повытерлись, – обтирая рукавом грязь с лица, говорил пехотинец; – а то не человек, а птица сидит!
– То то бы тебя, Зикин, на коня посадить, ловок бы ты был, – шутил ефрейтор над худым, скрюченным от тяжести ранца солдатиком.
– Дубинку промеж ног возьми, вот тебе и конь буде, – отозвался гусар.

Остальная пехота поспешно проходила по мосту, спираясь воронкой у входа. Наконец повозки все прошли, давка стала меньше, и последний батальон вступил на мост. Одни гусары эскадрона Денисова оставались по ту сторону моста против неприятеля. Неприятель, вдалеке видный с противоположной горы, снизу, от моста, не был еще виден, так как из лощины, по которой текла река, горизонт оканчивался противоположным возвышением не дальше полуверсты. Впереди была пустыня, по которой кое где шевелились кучки наших разъездных казаков. Вдруг на противоположном возвышении дороги показались войска в синих капотах и артиллерия. Это были французы. Разъезд казаков рысью отошел под гору. Все офицеры и люди эскадрона Денисова, хотя и старались говорить о постороннем и смотреть по сторонам, не переставали думать только о том, что было там, на горе, и беспрестанно всё вглядывались в выходившие на горизонт пятна, которые они признавали за неприятельские войска. Погода после полудня опять прояснилась, солнце ярко спускалось над Дунаем и окружающими его темными горами. Было тихо, и с той горы изредка долетали звуки рожков и криков неприятеля. Между эскадроном и неприятелями уже никого не было, кроме мелких разъездов. Пустое пространство, саженей в триста, отделяло их от него. Неприятель перестал стрелять, и тем яснее чувствовалась та строгая, грозная, неприступная и неуловимая черта, которая разделяет два неприятельские войска.
«Один шаг за эту черту, напоминающую черту, отделяющую живых от мертвых, и – неизвестность страдания и смерть. И что там? кто там? там, за этим полем, и деревом, и крышей, освещенной солнцем? Никто не знает, и хочется знать; и страшно перейти эту черту, и хочется перейти ее; и знаешь, что рано или поздно придется перейти ее и узнать, что там, по той стороне черты, как и неизбежно узнать, что там, по ту сторону смерти. А сам силен, здоров, весел и раздражен и окружен такими здоровыми и раздраженно оживленными людьми». Так ежели и не думает, то чувствует всякий человек, находящийся в виду неприятеля, и чувство это придает особенный блеск и радостную резкость впечатлений всему происходящему в эти минуты.
На бугре у неприятеля показался дымок выстрела, и ядро, свистя, пролетело над головами гусарского эскадрона. Офицеры, стоявшие вместе, разъехались по местам. Гусары старательно стали выравнивать лошадей. В эскадроне всё замолкло. Все поглядывали вперед на неприятеля и на эскадронного командира, ожидая команды. Пролетело другое, третье ядро. Очевидно, что стреляли по гусарам; но ядро, равномерно быстро свистя, пролетало над головами гусар и ударялось где то сзади. Гусары не оглядывались, но при каждом звуке пролетающего ядра, будто по команде, весь эскадрон с своими однообразно разнообразными лицами, сдерживая дыханье, пока летело ядро, приподнимался на стременах и снова опускался. Солдаты, не поворачивая головы, косились друг на друга, с любопытством высматривая впечатление товарища. На каждом лице, от Денисова до горниста, показалась около губ и подбородка одна общая черта борьбы, раздраженности и волнения. Вахмистр хмурился, оглядывая солдат, как будто угрожая наказанием. Юнкер Миронов нагибался при каждом пролете ядра. Ростов, стоя на левом фланге на своем тронутом ногами, но видном Грачике, имел счастливый вид ученика, вызванного перед большою публикой к экзамену, в котором он уверен, что отличится. Он ясно и светло оглядывался на всех, как бы прося обратить внимание на то, как он спокойно стоит под ядрами. Но и в его лице та же черта чего то нового и строгого, против его воли, показывалась около рта.
– Кто там кланяется? Юнкег" Миг"онов! Hexoг"oшo, на меня смотг"ите! – закричал Денисов, которому не стоялось на месте и который вертелся на лошади перед эскадроном.
Курносое и черноволосатое лицо Васьки Денисова и вся его маленькая сбитая фигурка с его жилистою (с короткими пальцами, покрытыми волосами) кистью руки, в которой он держал ефес вынутой наголо сабли, было точно такое же, как и всегда, особенно к вечеру, после выпитых двух бутылок. Он был только более обыкновенного красен и, задрав свою мохнатую голову кверху, как птицы, когда они пьют, безжалостно вдавив своими маленькими ногами шпоры в бока доброго Бедуина, он, будто падая назад, поскакал к другому флангу эскадрона и хриплым голосом закричал, чтоб осмотрели пистолеты. Он подъехал к Кирстену. Штаб ротмистр, на широкой и степенной кобыле, шагом ехал навстречу Денисову. Штаб ротмистр, с своими длинными усами, был серьезен, как и всегда, только глаза его блестели больше обыкновенного.
– Да что? – сказал он Денисову, – не дойдет дело до драки. Вот увидишь, назад уйдем.
– Чог"т их знает, что делают – проворчал Денисов. – А! Г"остов! – крикнул он юнкеру, заметив его веселое лицо. – Ну, дождался.
И он улыбнулся одобрительно, видимо радуясь на юнкера.
Ростов почувствовал себя совершенно счастливым. В это время начальник показался на мосту. Денисов поскакал к нему.
– Ваше пг"евосходительство! позвольте атаковать! я их опг"окину.
– Какие тут атаки, – сказал начальник скучливым голосом, морщась, как от докучливой мухи. – И зачем вы тут стоите? Видите, фланкеры отступают. Ведите назад эскадрон.
Эскадрон перешел мост и вышел из под выстрелов, не потеряв ни одного человека. Вслед за ним перешел и второй эскадрон, бывший в цепи, и последние казаки очистили ту сторону.
Два эскадрона павлоградцев, перейдя мост, один за другим, пошли назад на гору. Полковой командир Карл Богданович Шуберт подъехал к эскадрону Денисова и ехал шагом недалеко от Ростова, не обращая на него никакого внимания, несмотря на то, что после бывшего столкновения за Телянина, они виделись теперь в первый раз. Ростов, чувствуя себя во фронте во власти человека, перед которым он теперь считал себя виноватым, не спускал глаз с атлетической спины, белокурого затылка и красной шеи полкового командира. Ростову то казалось, что Богданыч только притворяется невнимательным, и что вся цель его теперь состоит в том, чтоб испытать храбрость юнкера, и он выпрямлялся и весело оглядывался; то ему казалось, что Богданыч нарочно едет близко, чтобы показать Ростову свою храбрость. То ему думалось, что враг его теперь нарочно пошлет эскадрон в отчаянную атаку, чтобы наказать его, Ростова. То думалось, что после атаки он подойдет к нему и великодушно протянет ему, раненому, руку примирения.

Все чаще в многочисленных проектах, книгах, брошюрах, интернет-ресурсах можно встретить понятие "тезаурус". Словно таинственное явление, оно пугает своей неизведанностью, ведь куда проще сказать "словарь", нежели использовать странное определение.

Тезаурус: что это? Чем он отличается от обычного словаря? Попытаемся изучить данные вопросы более подробно и доступно.

Трактовка термина

Первоначально понятие тезауруса рассматривалось с точки зрения словаря, представлявшего лексику языка с примерами употребления в тексте.

Ожегов трактует тезаурус как словарь конкретного языка, отражающий лексику в полной мере, в то время как Ефремова рассматривает данный феномен с точки зрения систематизированного набора данных в определенной области знания.

Наиболее конкретное определение используется в филологии, там под тезаурусом понимается компонент словарного типа, где все значения слов связаны семантическими отношениями между собой и отражают ключевые соотношения понятий в определенной предметной области.

Как мы видим, довольно сложно ответить на вопрос: "Тезаурус: что это?" однозначно. Для более узкого изучения термина рассмотрим историю возникновения, виды и отношения лексических единиц в словаре подобного типа.

История возникновения

Отцом-основателем тезаурусов считается английский физик Роже, именно он в 1852 г. систематизировал распределив ее по группам. При этом каждая группа была представлена названием понятия, а далее шли его синонимы по определенным частям речи, списки родственных наименований, а также отсылки к именам других категорий. Идея такой классификации была очень ценной, поскольку словарь считался самым естественным, описывал лексику языка в самой полной мере. При этом он мог быть применен в качестве быстрого поиска важных понятий. Со времен первого тезауруса и до сих пор происходит регулярная трансформация данного типа словаря, который применяется во многих областях знаний и пользуется широкой популярностью во всем мире. При этом изучение темы: «Тезаурус: что это?» актуально во многих учебных заведениях.

До настоящего времени тезаурусы остаются наиболее популярным способом описания знаний в любой области, необходимой для эффективного восприятия человеком.

Отношения слов в тезаурусе

Самыми распространенными отношениями в классическом тезаурусе считаются:

  1. Синонимия - явление, при котором связываются слова одной части речи, сходные по лексическому значению. Например: держава-отчизна, бригада-отряд, алый - красный и т.д.
  2. Антонимия - связь слов одной части речи, имеющих противоположное лексическое значение. Например: тишина - грохот, ласковый - грубый .
  3. Гиперонимия (гипонимия) - ключевые отношения с целью описания существительных. Гипероним имеет широкое лексическое значение, выражает родовое, общее наименование класса (множества) объектов, предметов, а именно его свойств и признаков. Гипоним обладает узким значением, он называет предмет (признак, свойство) как элемент конкретного множества или класса. Для того чтобы эти отношения стали понятными, приведем простейший пример. Слова зверь и тигр связаны между собой, при этом общее наименование - зверь - является гиперонимом по отношению к гипониму тигр.
  4. Меронимия (партонимия) - отношения для существительных, складываются по принципу «часть - целое». В качестве примера рассмотрим слова самолет, шасси , иллюминатор . В данном случае общее наименование транспорта - холоним (целое, имя), а его составные части - меронимы.
  5. Следствие (отношения между глаголами). Например, слова идти и прийти связаны процессом и его следствием (результатом).
  6. Причина (также допустимо только для глаголов). Рассмотрим пример таких отношений, возьмем слова: болеть - пропустить . В этом случае прослеживается причина - пропустить, потому что были проблемы со здоровьем.

Что тезаурус представляет собой, увидим из следующего примера.

Кровать - приспособление для сна.

[гипероним]: мебель
[мероним]: дом
[синоним]: лежанка, полати.

Это лишь классический пример тезауруса русского языка, однако все словари данного типа строятся именно по такому принципу.

Функции тезауруса

Словарь-тезаурус несет важные социальные, коммуникационные, научные и другие функции.

Он является:

  • источником специальных знаний в широкой либо узкой предметной области, способом упорядочения, описания терминов ;
  • инструментом поиска в информационном потоке;
  • инструментом ручного анализа документации в поисковых системах;
  • инструментом автоматического индексирования сложных текстов.

Виды тезаурусов

Многообразие словарей требует рассматривать не только вопрос: "Тезаурус: что это?", но и обращать внимание на виды. Это поможет нам лучше усвоить особенности данного типа словарей.


Заключение

Мы надеемся, что смогли доступным языком объяснить, что такое тезаурус. Благодаря примерам легко понять, чем он отличается от остальных словарей. Также мы осветили вопрос об информационно-поисковых тезаурусах, которые широко используются информационной системой для быстрого поиска и систематизации миллионов наименований.

Значение слова ТЕЗАУРУС в Лингвистическом энциклопедическом словаре

ТЕЗАУРУС

(от греч. thesauros — сокровище, сокровищница) — 1) словарь, в к-ром максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах; 2) идеографический словарь, в к-ром показаны семантические отношения (родовидовые, синонимические и др.) между лексическими единицами. Т. в 1-м значении в полном объеме осуществим лишь для мертвых языков, ср. «Thesaurus linguae latinae» (с 1900). К этому типу приближается, напр., «Словарь польского языка XVI в.» (с 1966). Для живых языков требование исчерпывающей цитации примеров неосуществимо (ср. попытку изменения типа академич. «Словаря русского языка» А. А. Шахматова, т. 2, 1907, т. 4, 1916, и Л. В. Щербы, продолживших работу Я. К. Грота), Структурной основой Т. во 2-м значении обычно служит иерархич. система понятий, обеспечивающая поиск от смыслов к лексич. единицам (т. е. поиск слов, исходя из понятия). Для поиска в обратном направлении (т. е. от слова к понятию) используется алфавитный указатель. Так, напр., построен тезаурус П. М. Роже «Roget"s thesaurus of English words and phrases» (1852), от названия к-poro в лексикология, практику вошло 2-е значение термина «Т.». В теоре-тич. отношении Т. является одной из возможных моделей семантич. системы лексики. Практически используется как средство обогащения индивидуального словаря пишущего. В практике информационной работы большое распространение получили информационно-поисковые Т., гл. задача к-рых — единообразная замена лексич. единиц текста стандартизов. словами и выражениями (дескрипторами) при индексировании документов и использование родо-вндовых и ассоциативных связей между дескрипторами при автоматизированном информационном поиске документов. . Михайлов Л. И., Ч е р и ы й А.И., Гиляревский Р. С Основы информатики. 2 изд., М., 1968; Ш рей дер Ю. А.. Тезаурусы в информатике и теоре-тнч. семантике. «Науч.-технич. информация. Сер. 2», 1971, Ms 3; Караулов Ю. Н., Общая и рус. идеография, М., 1976; Dornseiff F., Der deutsche Wortschatz nach Sachgruppen, Tl 1—2, В.— Lpz., 1933 — 1934; С as a res у Sanchez J., Diccio-nario ideologico de la lengua espanola, 2 ed., Barcelona. 1959; H a 1 1 e r J., Cesky slov-nik vecny a synonymicky, dl 1 — 3. Praha. 1969—77. А. Я. Шайкевич.

Лингвистический энциклопедический словарь. 2012

Смотрите еще толкования, синонимы, значения слова и что такое ТЕЗАУРУС в русском языке в словарях, энциклопедиях и справочниках:

  • ТЕЗАУРУС в Большом энциклопедическом словаре:
    (от греч. thesauros - сокровище) ..1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте …
  • ТЕЗАУРУС в Большой советской энциклопедии, БСЭ:
    (от греч. thesauros - сокровище, сокровищница), множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических (см. Семантика) …
  • ТЕЗАУРУС в Энциклопедическом словаре Брокгауза и Евфрона:
    см. древнегреческое искусство …
  • ТЕЗАУРУС в Современном энциклопедическом словаре:
  • ТЕЗАУРУС
    (от греческого thesauros - сокровище), 1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте …
  • ТЕЗАУРУС в Энциклопедическом словарике:
    , а, м. 1. лингв. Словарь (языка в целом или языка какой-нибудь специальной сферы деятельности) с полной и логически упорядоченной …
  • ТЕЗАУРУС в Энциклопедическом словаре:
    [тэ], -а, м. (спец.). 1. Словарь языка, ставящий задачу полного отражения всей его лексики. 2. Словарь или свод данных, полностью …
  • ТЕЗАУРУС в Большом российском энциклопедическом словаре:
    ТЕЗ́АУРУС (от греч. thesauros - сокровище), словарь, в к-ром максимально полно представлены слова языка с примерами их употребления в тексте …
  • ТЕЗАУРУС в Энциклопедии Брокгауза и Ефрона:
    ? см. древнегреческое искусство …
  • ТЕЗАУРУС в Полной акцентуированной парадигме по Зализняку:
    теза"урус, теза"урусы, теза"уруса, теза"урусов, теза"урусу, теза"урусам, теза"урус, теза"урусы, теза"урусом, теза"урусами, теза"урусе, …
  • ТЕЗАУРУС в Новом словаре иностранных слов:
    (гр. thesauros запас) 1) лингв. словарь языка с полной смысловой информацией; 2) в информатике-полный систематизированный набор данных о какой-л. …
  • ТЕЗАУРУС в Словаре иностранных выражений:
    [ 1. лингв. словарь языка с полной смысловой информацией; 2. в информатике-полный систематизированный набор данных о какой-л. области знания, позволяющий …
  • ТЕЗАУРУС в словаре Синонимов русского языка:
    макротезариус, свод, …
  • ТЕЗАУРУС в Новом толково-словообразовательном словаре русского языка Ефремовой:
    м. 1) Словарь какого-л. языка, представляющий его лексику в полном объеме. 2) Полный систематизированный набор данных о какой-л. области знания, …
  • ТЕЗАУРУС в Полном орфографическом словаре русского языка:
    тезаурус, …
  • ТЕЗАУРУС в Орфографическом словаре:
    тез`аурус, …
  • ТЕЗАУРУС в Словаре русского языка Ожегова:
    словарь языка, ставящий задачу полного отражения всей его лексики тезаурус словарь или свод данных, полностью охватывающий термины, понятия какой-нибудь специальной …
  • ТЕЗАУРУС в Современном толковом словаре, БСЭ:
    (от греч. thesauros - сокровище),..1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в …
  • ТЕЗАУРУС в Толковом словаре Ефремовой:
    тезаурус м. 1) Словарь какого-л. языка, представляющий его лексику в полном объеме. 2) Полный систематизированный набор данных о какой-л. области …
  • ТЕЗАУРУС в Новом словаре русского языка Ефремовой:
    м. 1. Словарь какого-либо языка, представляющий его лексику в полном объеме. 2. Полный систематизированный набор данных о какой-либо области знания, …
  • ТЕЗАУРУС в Большом современном толковом словаре русского языка:
    м. 1. Словарь, стремящийся отразить весь словарный состав языка с исчерпывающим перечнем примеров их употребления в текстах (в лингвистике …
  • ПЛАТОН
    (Plato) (428/427-348/347 до н.э.) -древнегреческий философ, классик философской традиции; мыслитель мирового масштаба, к чьей оригинальной философской концепции генетически восходят многие …
  • ИСТОРИЦИЗМ в Новейшем философском словаре:
    стратегия исторического (и - шире - гуманитарного) познания, предполагающая постижение истории с парадигмальной позиции снятия субъект-объектной оппозиции внутри когнитивной процедуры. …
  • ПУСТОЙ ЗНАК в Словаре постмодернизма:
    - понятие постмодернистской философии, фиксирующее парадигмальную презумпцию постмодернизма на восприятие семиотических сред как самодостаточной реальности - вне какой бы то …
  • КОНЦЕПТУАЛЬНОЕ ИСКУССТВО в Словаре постмодернизма:
    - наиболее радикальное направление в рамках авангарда "новой волны" (см. "Новой волны" авангард), фундированное презумпцией отказа от генетической связи художественного …
  • ДЕНОТАТ в Словаре постмодернизма:
    (лат. de-notation - обозначение) - множество онтологически артикулированных предметов, обозначаемых данным именем. Денотативный процесс есть отношение имени к предмету безотносительно …
  • КЛАССИЧЕСКАЯ ФИЛОЛОГИЯ в Словаре Кольера:
    критическое и экзегетическое изучение литературы Древней Греции и Рима, исследование всех этапов античного быта, истории, философии, языка и искусства. История …

Под тезаурусом понимается сложный компонент словарного типа, в котором все значения словаря связаны между собой семантическими отношениями, отражающими основные соотношения понятий в описываемой предметной области знаний. В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

В состав тезауруса входят лексемы , относящиеся к четырем частям речи: прилагательному, существительному, глаголу и наречию. Описания, соответствующие каждой части речи, имеют различную структуру.

Основными отношениями в тезаурусе являются:

  • синонимия – связь между словами одной части речи, различных по звучанию и написанию, но имеющих одинаковое или очень близкое лексическое значение, например: кавалерия – конница, смелый – храбрый;
  • антонимия – связь между словами одной части речи, различных по звучанию, имеющих прямо противоположные значения: правда – ложь, добрый – злой;
  • гипонимия/гиперонимия. Гипероним – слово с более широким значением, выражающее общее, родовое понятие, название класса (множества) предметов (свойств, признаков). Гипоним – слово с более узким значением, называющее предмет (свойство, признак) как элемент класса (множества). Эти отношения транзитивны и несимметричны. Гипоним наследует все свойства гиперонима. Являются центральными отношениями для описания существительных;
  • меронимия/партонимия – отношение «ЧАСТЬ-ЦЕЛОЕ». Внутри этого отношения выделяются отношения «быть элементом» и «быть сделанным из». Отношение определено только для существительных;
  • следствие (это отношение связывает между собой глаголы);
  • причина (также определено для глаголов).

Пример тезауруса:

Изба – деревянный крестьянский дом [гипероним]: жилое здание [мероним]: сельский населенный пункт [синоним]: дом

Все отношения создают сложную иерархическую сеть понятий, и знание о том, где находится понятие в этой сети, является важной частью знания об этом понятии. Свойства отношений различны при описании различных частей речи.

В разных системах тезаурус может выполнять разные функции:

  • источник специальных знаний в узкой или широкой предметной области, способ описания и упорядочения терминологии предметной области;
  • инструмент поиска в информационно-поисковых системах;
  • инструмент ручного индексирования документов в информационно-поисковых системах (так называемый контролирующий словарь);
  • инструмент автоматического индексирования текстов.

Начало тезаурусам как понятийным словарям положил Роже (или Роджет, английский физик), систематизировавший лексику английского языка по группам. Каждая группа представлена именем понятия («категории», которых насчитывалось сначала одна тысяча; это обычные слова, расположенные в алфавитном порядке, например AFFIRMATION ... AGENCY...), далее идут его синонимы по частям речи (существительные, глаголы, прилагательные, наречия), антонимы и затем списки родственных слов (их много, и некоторые представляют собой отсылки к именам других категорий, в словарной статье которых список «дальних родственников» может продолжаться, например, от AGENCY... see BUSINESS). Со времени издания тезауруса Роже в 1852г. и до сих пор продолжаются его переиздания в разных видах и для разных пользователей, тезаурус постоянно пополняется новой лексикой и связями, но за всеми вариантами остается имя создателя первой версии. Ценность этого тезауруса в его естественности, в том, что это описание всей лексики языка, а не только терминологии, а также в том, что его можно привлекать к использованию в системах информационного поиска как средство увеличения семантической силы системы.

Тезаурусы остаются до настоящего времени наиболее принятой формой описания знаний предметной области, пригодной для восприятия человеком. Примерами современных иностранных тезаурусов являются WordNet и EuroWordNet.

Тезаурус английского языка WordNet появился в 1990г. и начал активно привлекаться в различные сферы автоматической обработки текстов. WordNet охватывает около 100 тыс. различных единиц (из них почти половина – словосочетания), организованных в 70 000 понятий.

В настоящее время начинает разрабатываться многоязычный тезаурус EuroWordNet. Первоначально для четырех языков (датского, итальянского, испанского и американского английского) разрабатывается сеть значений слов, связанная семантическими отношениями и позволяющая находить близкие по смыслу слова различных языков. В отличие от тезауруса Роже и сети WordNet, которые создавались для описания лексической и понятийной системы английского языка, EuroWordNet создается в первую очередь для решения практических задач автоматической обработки больших массивов текстов. Важнейшими задачами, которые предполагается решать с помощью этого тезауруса, являются следующие:

  • обеспечение многоязычного информационного поиска;
  • увеличение полноты информационного поиска;
  • формулирование запроса на естественном языке;
  • семантическое индексирование документов и др.

Кроме этих отношений вводятся также тематические отношения, которые связывают понятия одной предметной области. Предполагается также ввести специальные пометки на отношения между понятиями, обозначающие дизъюнкцию или конъюнкцию отношений. Если некоторое понятие в сети имеет несколько одноименных отношений, то они могут быть дизъюнктивными, т. е. реально реализуется одно из этих отношений, или конъюнктивными, т. е. для понятия действительны все эти отношения.

В отечественных институтах создано более сотни отраслевых тезаурусов, удовлетворяющих определенному государственному стандарту на словари подобного типа. Они так и именуются – ИПТ – информационно-поисковые тезаурусы. Из всех возможных смысловых отношений между понятиями в них зафиксированы три: синонимические, родовидовые (к которым относят обычно и отношение «ЧАСТЬ-ЦЕЛОЕ») и «все прочие», называемые также ассоциативными.

Стандартные ИПТ предназначены в основном для ручного индексирования документов, а также для формулировки и варьирования запросов при поиске. Есть нестандартные тезаурусы, которые ставят задачу скорее выборочной систематизации терминологии в конкретной области знаний – это особенно актуально для новых предметных областей. Растет тенденция к обогащению тезаурусов определениями терминов, что важно для различения неоднозначности терминов, особенно в случае смежных дисциплин и при выходе из границ узких предметных областей.