Тезаурус: що таке. Словник-тезаурус, який більший за словник. Тезаурус. лінгвістичні принципи побудови тезаурусу Сучасні тезауруси

, антоніми, пароніми, гіпоніми, гіпероніми тощо) між лексичними одиницями. Тезаурус є одним з дієвих інструментів для опису окремих предметних областей.

У минулому терміном тезауруспозначалися переважно словники, які з максимальною повнотою представляли лексику мови з прикладами її вживання у текстах.

Також термін тезаурусВикористовується теоретично інформації позначення сукупності всіх відомостей, якими має суб'єкт.

У психології тезаурус індивідуума характеризують сприйняття та розуміння інформації. Теорія комунікації також розглядає загальний тезаурус складної системи, завдяки якому взаємодіють її елементи.

Історія

Одним із перших тезаурусів називають «Словник синонімів» Філона Біблського. Точнішу відповідність терміну має Амара-коша, написаний на санскриті у віршованій формі у VI столітті. Перший сучасний англійський тезаурус був створений Пітером Марком Роже (англ.) у 1805 році. Він був опублікований в 1852 році і з того часу використовується без перевидань.

У 1970-ті роки тезаурус стали активно використовуватися для інформаційно-пошукових завдань. У таких тезаурусах слова зіставляються з дескрипторами, якими встановлюються семантичні зв'язки .

Тезауруси

Див. також

Напишіть відгук про статтю "Тезаурус"

Примітки

Уривок, що характеризує Тезаурус

- Яким ти хизуванням нині! – оглядаючи його новий ментик та вальтрап, сказав Несвицький.
Денисов усміхнувся, дістав із ташки хустку, що розповсюджував запах парфумів, і засунув у ніс Несвицькому.
- Не можна, у справу йду! вибігся, зуби вичистив і надушився.
Осаниста постать Несвицького, що супроводжувалась козаком, і рішучість Денисова, що махав шаблею і відчайдушно кричав, подіяли так, що вони протискалися на той бік мосту і зупинили піхоту. Несвицький знайшов біля виїзду полковника, якому треба було передати наказ, і, виконавши своє доручення, поїхав назад.
Розчистивши дорогу, Денисов зупинився біля входу на міст. Недбало стримуючи лоша, що рвався до своїх і бився ногою, він дивився на ескадрон, що рухався йому назустріч.
По дошках мосту пролунали прозорі звуки копит, ніби скакало кілька коней, і ескадрон, з офіцерами попереду по чотири людини в ряд, розтягнувся мостом і став виходити на той бік.
Зупинені піхотні солдати, юрмлячись у розтоптаному біля мосту бруду, з тим особливим недоброзичливим почуттям відчуженості й глузування, з яким зустрічаються зазвичай різні пологи військ, дивилися на чистих, чепурних гусар, що струнко проходили повз них.
– Ошатні хлопці! Аби тільки на Подновинське!
- Що від них користі! Тільки напоказ і водять! – говорив інший.
- Піхота, не пилюки! – жартував гусар, під яким кінь, загравши, бризнув брудом у піхотинця.
- Проганяв би тебе з ранцем переходу два, шнурки щось повитерлися б, - обтираючи рукавом бруд з обличчя, говорив піхотинець; - а то не людина, а птах сидить!
— То б тобі тебе, Зикін, на коня посадити, спритний би ти був, — жартував єфрейтор над худим, скрюченим від тяжкості ранця солдатиком.
– Дубинку між ніг візьми, ось тобі й кінь буде, – озвався гусар.

Решта піхоти поспішно проходила мостом, опираючись воронкою біля входу. Нарешті візки всі пройшли, тиснява поменшала, і останній батальйон вступив на міст. Одні гусари ескадрону Денисова залишалися з того боку мосту проти ворога. Ворог, далеко видно з протилежної гори, знизу, від мосту, не був ще видно, тому що з лощини, якою текла річка, горизонт закінчувався протилежним піднесенням не далі півверсти. Попереду була пустеля, де десь ворушилися купки наших роз'їзних козаків. Раптом на протилежному піднесенні дороги з'явилися війська в синіх капотах та артилерія. То були французи. Роз'їзд козаків риссю відійшов під гору. Всі офіцери і люди ескадрону Денисова, хоч і намагалися говорити про стороннє і дивитися на всі боки, не переставали думати тільки про те, що було там, на горі, і безперестанку все вдивлялися в плями, які вони визнавали за ворожі війська. Погода після полудня знову проясніла, сонце яскраво спускалося над Дунаєм і навколишніми темними горами. Було тихо, і з тієї гори зрідка долинали звуки ріжків та криків ворога. Між ескадроном та ворогами вже нікого не було, крім дрібних роз'їздів. Порожній простір, сажнів за триста, відділяв їх від нього. Ворог перестав стріляти, і тим ясніше відчувалася та сувора, грізна, неприступна і невловима риса, яка поділяє два ворожі війська.
«Один крок за цю межу, що нагадує межу, що відокремлює живих від мертвих, і – невідомість страждання і смерть. І що там? хто там? там, за цим полем, і деревом, і дахом, освітленим сонцем? Ніхто не знає і хочеться знати; і страшно перейти цю межу, і хочеться перейти її; і знаєш, що рано чи пізно доведеться перейти її і дізнатися, що там, з того боку риси, як і неминуче дізнатися, що там, з того боку смерті. А сам сильний, здоровий, веселий і роздратований і оточений такими здоровими та роздратовано жвавими людьми». Так якщо і не думає, то відчуває будь-яка людина, що знаходиться на увазі ворога, і це почуття надає особливий блиск і радісну різкість вражень усьому, що відбувається в ці хвилини.
На бугрі у ворога з'явився димок пострілу, і ядро, свистячи, пролетіло над головами гусарського ескадрону. Офіцери, що стояли разом, роз'їхалися на місця. Гусари старанно почали вирівнювати коней. В ескадроні все замовкло. Усі поглядали вперед на ворога та на ескадронного командира, чекаючи на команду. Пролетіло інше, третє ядро. Очевидно, що стріляли по гусарах; але ядро, рівномірно швидко свистячи, пролітало над головами гусар і вдарялося десь позаду. Гусари не оглядалися, але при кожному звуку пролітаючого ядра, ніби по команді, весь ескадрон зі своїми різноманітними обличчями, стримуючи дихання, поки летіло ядро, підводився на стременах і знову опускався. Солдати, не повертаючи голови, косилися один на одного, з цікавістю дивлячись на товариша. На кожному обличчі, від Денисова до горниста, з'явилася біля губ і підборіддя одна спільна риса боротьби, роздратування та хвилювання. Вахмістр хмурився, оглядаючи солдатів, ніби загрожуючи покаранням. Юнкер Миронов нагинався під час кожного прольоту ядра. Ростов, стоячи на лівому фланзі на своєму зворушеному ногами, але видному Грачику, мав щасливий вигляд учня, викликаного перед великою публікою до іспиту, в якому він впевнений, що відзначиться. Він ясно і ясно оглядався на всіх, ніби просячи звернути увагу на те, як він спокійно стоїть під ядрами. Але і в його обличчі та ж риса чогось нового і суворого, проти його волі, показувалася біля рота.
– Хто там кланяється? Юнкег "Міг"онів! Hexoг"шо, на мене дивіться"! - Закричав Денисов, якому не стояло на місці і який крутився на коні перед ескадроном.
Курносе і чорноволосе обличчя Васьки Денисова і вся його маленька збита фігурка з його жилистим (з коротким пальцем, покритим волоссям) пензлем руки, в якій він тримав ефес витягнутої наголо шаблі, було таке саме, як і завжди, особливо надвечір, після випитих двох пляшок. Він був тільки звичайнісінький червоний і, задерши свою волохату голову вгору, як птахи, коли вони п'ють, безжально втиснувши своїми маленькими ногами шпори в боки доброго Бедуїна, він, ніби падаючи назад, поскакав до іншого флангу ескадрону і хрипким голосом закричав, щоб пістолети. Він під'їхав до Кірстена. Штаб ротмістр, на широкій і статечній кобилі, кроком їхав назустріч Денисову. Штаб ротмістр, зі своїми довгими вусами, був серйозним, як і завжди, тільки очі його блищали більше, ніж звичайно.
- Та що? - Сказав він Денисову, - не дійде справа до бійки. От побачиш, назад підемо.
- Чог" їх знає, що роблять - пробурчав Денисов. - А! Г"кістів! – крикнув він юнкерові, помітивши його веселе обличчя. – Ну, дочекався.
І він посміхнувся схвально, мабуть радіючи на юнкера.
Ростов відчув себе щасливим. В цей час начальник здався на мосту. Денисов поскакав до нього.
- Ваше превосходительство! дозвольте атакувати! я їх опгокину.
- Які тут атаки, - сказав начальник сумним голосом, морщачись, як від докучливої ​​мухи. – І навіщо ви тут стоїте? Бачите, фланкери відступають. Ведіть ескадрон назад.
Ескадрон перейшов міст і вийшов з-під пострілів, не втративши жодної людини. Слідом за ним перейшов і другий ескадрон, що був у ланцюзі, і останні козаки очистили той бік.
Два ескадрони павлоградців, перейшовши міст один за одним, пішли назад на гору. Полковий командир Карл Богданович Шуберт під'їхав до ескадрону Денисова і їхав кроком неподалік Ростова, не звертаючи на нього жодної уваги, незважаючи на те, що після колишнього зіткнення за Телянина, вони бачилися тепер уперше. Ростов, відчуваючи себе у фронті у владі людини, перед яким він тепер вважав себе винним, не зводив очей з атлетичної спини, білявої потилиці та червоної шиї полкового командира. Ростову то здавалося, що Богданович тільки прикидається неуважним, і що вся мета його тепер полягає в тому, щоб випробувати хоробрість юнкера, і він випростувався і весело озирався; то йому здавалося, що Богданович навмисне їде близько, щоб показати Ростову свою хоробрість. То йому думалося, що ворог його тепер навмисне надішле ескадрон у відчайдушну атаку, щоб покарати його, Ростова. То думалося, що після атаки він підійде до нього і великодушно простягне йому, пораненому, руку примирення.

Під тезаурусомрозуміється складний компонент словникового типу, в якому всі значення словника пов'язані між собою семантичними відносинами, що відображають основні співвідношення понять в предметній області знань, що описується. У минулому терміном тезаурус позначалися переважно словники, що з максимальною повнотою представляли лексику мови з прикладами її вживання в текстах.

До складу тезаурусу входять лексеми, що відносяться до чотирьох частин мови: прикметник, іменник, дієслово та прислівник. Описи, що відповідають кожній частині мови, мають різну структуру.

Основними відносинами у тезаурусі є:

  • синонімія– зв'язок між словами однієї частини мови, різних за звучанням і написанням, але мають однакове або дуже близьке лексичне значення, наприклад: кавалерія – кіннота, сміливий – хоробрий;
  • антонімія– зв'язок між словами однієї частини мови, різних за звучанням, що мають прямо протилежні значення: правда – брехня, добрий – злий;
  • гіпонімія/гіперонімія. Гіперонім- Слово з ширшим значенням, що виражає загальне, родове поняття, назва класу (множини) предметів (властивостей, ознак). Гіпонім- Слово з вужчим значенням, що називає предмет (властивість, ознака) як елемент класу (множини). Ці відносини транзитивні та несиметричні. Гіпонім успадковує всі властивості гіпероніму. Є центральними відносинами для опису іменників;
  • меронімія/партонімія- Відношення «ЧАСТИНА-ЦЕЛЕ». Усередині цього відносини виділяються відносини «бути елементом» і «бути зробленим». Ставлення визначено лише для іменників;
  • слідство (це відношення пов'язує між собою дієслова);
  • причина (також визначено для дієслів).

Приклад тезаурусу:

Хата – дерев'яний селянський будинок [гіперонім]: житлова будівля [меронім]: сільський населений пункт [синонім]: будинок

Всі відносини створюють складну ієрархічну мережу понять, і знання про те, де знаходиться поняття в цій мережі, є важливою частиною знання про це поняття. Властивості відносин різні в описах різних частин промови.

У різних системах тезаурус може виконувати різні функції:

  • джерело спеціальних знань у вузькій або широкій предметній галузі, спосіб опису та впорядкування термінології предметної області;
  • інструмент пошуку в інформаційно-пошукових системах;
  • інструмент ручного індексування документів в інформаційно-пошукових системах (так званий словник, що контролює);
  • інструмент автоматичного індексування текстів

Початок тезаурусам як понятійним словникам поклав Роже (чи Роджет, англійський фізик), який систематизував лексику англійської за групами. Кожна група представлена ​​ім'ям поняття («категорії», яких налічувалося спочатку одна тисяча; це звичайні слова, розташовані в алфавітному порядку, наприклад AFFIRMATION ... AGENCY ...), далі йдуть його синоніми частинами мови (іменники, дієслова, прикметники, прислівники), антоніми і потім списки споріднених слів (їх багато, і деякі є посилання до імен інших категорій, у словниковій статті яких список «далеких родичів» може продовжуватися, наприклад, від AGENCY... see BUSINESS). З часу видання тезаурусу Роже у 1852р. і досі тривають його перевидання у різних видах і для різних користувачів, тезаурус постійно поповнюється новою лексикою та зв'язками, але за всіма варіантами залишається ім'я творця першої версії. Цінність цього тезауруса у його природності, у тому, що це опис всієї лексики мови, а не лише термінології, а також у тому, що його можна залучати до використання в системах інформаційного пошуку як збільшення семантичної сили системи.

Тезауруси залишаються до сьогодні найбільш прийнятою формою опису знань предметної області, придатної сприйняття людиною. Прикладами сучасних іноземних тезаурусів є WordNet та EuroWordNet.

Тезаурус англійської мови WordNet виник 1990г. і почав активно залучатися до різних сфер автоматичної обробки текстів. WordNet охоплює близько 100 тис. різних одиниць (з них майже половина – словосполучення), організованих у 70 000 понять.

В даний час починає розроблятися багатомовний тезаурус EuroWordNet. Спочатку для чотирьох мов (датської, італійської, іспанської та американської англійської) розробляється мережа значень слів, пов'язана семантичними відносинами і дозволяє знаходити близькі за змістом слова різних мов. На відміну від тезаурусу Роже та мережі WordNet, які створювалися для опису лексичної та понятійної системи англійської мови, EuroWordNet створюється насамперед для вирішення практичних завдань автоматичного оброблення великих масивів текстів. Найважливішими завданнями, які передбачається вирішувати за допомогою цього тезаурусу, є:

  • забезпечення багатомовного інформаційного пошуку;
  • збільшення повноти інформаційного пошуку;
  • формулювання запиту природною мовою;
  • семантичне індексування документів та ін.

Крім цих відносин запроваджуються також тематичні відносини, які пов'язують поняття однієї предметної галузі. Передбачається також запровадити спеціальні позначки на відносини між поняттями, що позначають диз'юнкцію чи кон'юнкцію стосунків. Якщо деяке поняття в мережі має кілька однойменних відносин, то вони можуть бути диз'юнктивними, тобто реально реалізується одне з цих відносин або кон'юнктивними, тобто для поняття дійсні всі ці відносини.

У вітчизняних інститутах створено понад сотню галузевих тезаурусів, які задовольняють певний державний стандарт на словники такого типу. Вони так і називаються - ІПТ - інформаційно-пошукові тезауруси. З усіх можливих смислових відносин між поняттями в них зафіксовано три: синонімічні, родовидові (до яких відносять зазвичай і відношення «ЧАСТИНА-ЦЕЛЕ») та «всі інші», які називаються також асоціативними.

Стандартні ІПТ призначені в основному для ручного індексування документів, а також для формулювання та варіювання запитів під час пошуку. Є нестандартні тезауруси, які ставлять завдання скоріш вибіркової систематизації термінології у конкретній галузі знань – це особливо актуально нових предметних областей. Зростає тенденція до збагачення тезаурусів термінами, що важливо для розрізнення неоднозначності термінів, особливо у випадку суміжних дисциплін і при виході з меж вузьких предметних областей.

Розділ дуже простий у використанні. У запропоноване поле достатньо ввести потрібне слово, і ми видамо список його значень. Хочеться відзначити, що наш сайт надає дані з різних джерел – енциклопедичного, тлумачного, словотвірного словників. Також тут можна познайомитись з прикладами вживання введеного вами слова.

Значення слова тезаурус

тезаурус у словнику кросвордиста

Тлумачний словник російської. С.І.Ожегов, Н.Ю.Шведова.

тезаурус

[те], -а, м. (спец.).

    Словник мови, що ставить завдання повного відображення всієї його лексики.

    Словник або зведення даних, що повністю охоплює терміни, поняття який-н. спеціальної сфери.

    дод. тезаурусний, -а, -а.

Новий тлумачно-словотвірний словник російської, Т. Ф. Єфремова.

тезаурус

    Словник якогось л. мови, що репрезентує його лексику в повному обсязі.

    Повний систематизований набір даних про який-л. галузі знання, що дозволяє людині чи обчислювальній машині в ній орієнтуватися (в інформатиці).

Енциклопедичний словник, 1998

тезаурус

ТЕЗАУРУС (від грец. thesauros - скарб)

    словник, в якому максимально повно представлені слова мови з прикладами їх вживання в тексті (у повному обсязі здійснимо лише для мертвих мов).

    Словник, в якому слова, що належать до будь-якої галузі знання, розташовані за тематичним принципом та показані семантичні відносини (родо-видові, синонімічні та ін) між лексичними одиницями. В інформаційно-пошукових тезаурусах лексичні одиниці тексту замінюються на дескриптори.

Тезаурус

(від грец. thesaurós ≈ скарб, скарбниця), безліч сенсовиражальних одиниць деякої мови із заданою на ньому системою семантичних відносин. Т. фактично визначає семантику мови (національної мови, мови конкретної науки чи формалізованої мови для автоматизованої системи управління). Спочатку Т. розглядали як одномовний словник, у якому семантичні відносини визначаються угрупуванням слів за тематичними рубриками. Наприклад, англійська Т. (автор П. М. Роджет), виданий у 1962 (1-е видання 1852), містить 1040 рубрик, за якими розподілено близько 240 000 слів. Вказівник (ключ) до цього Т. містить алфавітний перелік слів із зазначенням рубрик та підрубрик, до яких належить кожне слово. Існують традиційні загальномовні Т. (описи семантичних систем окремих мов) для англійської, французької, іспанської мов. До Т. дуже близькі одномовні словники, що задають вирази основних семантичних параметрів кожного слова, наприклад словник російської С. І. Ожегова.

У 70-х роках. 20 ст. набули поширення інформаційно-пошукові Т. У цих Т. виділено спеціальні лексичні одиниці - дескриптори, за якими можна здійснювати автоматичний пошук документальної інформації. З кожним словом такого Т. зіставляється синонімічний дескриптор (див. Синонімія), і для дескрипторів явно вказуються семантичні відносини: рід - вид, частина - ціле, мета - засіб і т. д. Зазвичай прийнято розділяти родовидові (ієрархічні) і асоціативні стосунки. Так, «Інформаційно-пошуковий тезаурус з інформатики», виданий в СРСР у 1973 році, для кожного дескриптора передбачає словникову статтю, де окремо вказані синонімічні ключові слова, родові, видові та асоціативні дескриптори. Для кращої орієнтації в асоціативних зв'язках між дескрипторами до цього Т. додано семантичні карти тематичних класів. При автоматизованому інформаційному пошуку шукаються документи, у яких індекс містить як дескриптори запиту, а й ті дескриптори, що з ними у певних семантичних відносинах. Іноді буває корисно виділяти в Т. конкретні асоціативні відносини, специфічні для даної тематичної галузі: хвороба - збудник, прилад - призначення (або вимірювана величина) і т. п. Положення лексичної одиниці (слова, словосполучення) в Т. ; знання системи семантичних відносин, у які вступає це слово (зокрема і рубрик, куди воно входить), дозволяє будувати висновки про сенсі цього слова.

У широкому значенні Т. інтерпретують як опис системи знань про реальність, які має індивідуальний носій інформації або група носіїв. Цей носій може виконувати функції приймача додаткової інформації, внаслідок чого змінюється його Т. Вихідний Т. визначає при цьому можливості приймача при отриманні ним семантичної інформації. У психології та при вивченні систем зі штучним інтелектом розглядають властивості Т. індивідуумів, що виявляються при сприйнятті та розумінні інформації. У соціології та теорії комунікацій вивчають властивості Т. індивідуумів і колективів, що забезпечують можливість порозуміння на основі спільності Т. У цих ситуаціях у Т. доводиться включати складні висловлювання та їх семантичні зв'язки, що визначають запас відомості, які має складна система. Т. фактично містить як інформацію про дійсності, а й метаінформацію (відомості про інформацію), що забезпечує можливість прийому нових повідомлень.

Чорний А. І., Загальна методика побудови тезаурусів, «Науково-технічна інформація. Сер. 2», 1968, ╧5; Варга Д., Методика підготовки інформаційних тезаурусів, пров. [з угор.], М., 1970; Шрейдер Ю. А., Тезауруси в інформатиці та теоретичній семантиці, «Науково-технічна інформація. Сер. 2», 1971, ╧ З.

Ю. А. Шрейдер.

Вікіпедія

Тезаурус

Тезаурус, у загальному сенсі - спеціальна термінологія, більш строго і предметно - словник, збори відомостей, корпус або склепіння, що повномірно охоплюють поняття, визначення та терміни спеціальної галузі знань чи сфери діяльності, що має сприяти правильній лексичній, корпоративній комунікації; у сучасній лінгвістиці - особливий різновид словників, у яких зазначені семантичні відносини (синоніми, антоніми, пароніми, гіпоніми, гіпероніми тощо) між лексичними одиницями. Тезаурус є одним з дієвих інструментів для опису окремих предметних областей.

На відміну від тлумачного словника, тезаурус дозволяє виявити сенс як з допомогою визначення, а й у вигляді співвіднесення слова коїться з іншими поняттями та його групами, завдяки чому можна використовувати наповнення баз знань систем штучного інтелекту.

У минулому терміном тезауруспозначалися переважно словники, які з максимальною повнотою представляли лексику мови з прикладами її вживання у текстах.

Також термін тезаурусВикористовується теоретично інформації позначення сукупності всіх відомостей, якими має суб'єкт.

У психології тезаурус індивідуума характеризують сприйняття та розуміння інформації. Теорія комунікації також розглядає загальний тезаурус складної системи, завдяки якому взаємодіють її елементи.

Тезаурус (значення)

Тезаурус:

  • Тезаурус - словник, збори відомостей, що охоплюють поняття, визначення та терміни спеціальної галузі знань чи сфери діяльності.
  • Тезаурус Роже - один із перших в історії та найбільш відомих на сьогодні ідеографічних словників.

Приклади вживання слова тезаурус у літературі.

Для сприйняття та співтворчості необхідний якийсь оптимальний тезаурус, не малий, але й не надто великий.

При необмежено великій кількості інформації, що надходить, істотно перевищує тезаурус, її цінність від цієї кількості не залежить і повністю визначається тезаурусом.

Багатосторонність, системність мистецтва призводить до нерівномірності сприйняття твору загалом: для сприйняття одних аспектів вірша тезаурусОптимальний, для інших-недостатній або дуже великий.

Так як тезаурусзростає та змінюється, повторне ознайомлення з твором може означати отримання нової цінної інформації.

Прагнення дитини багаторазово перечитувати казку зрозуміло: її тезаурусшвидко зростає та її здатність до співтворчості, до асоціативного фантазування особливо велика.

Ця сторона справи більш мінлива і суб'єктивна, ніж тезаурус, й у пошуках об'єктивної естетичної оцінки твори її має звести до мінімуму.

Він проникає в тезауруспоета та адресує переклад тезаурусу іншомовного читача.

Це найголовніше полягає в тому, щоб визначити, наскільки великий твій тезаурус, Т.

Ні, просто його власний багаж – мізерний, він нерозвинений, його тезаурусзнаходиться в зародковому стані, і якщо він не зрозуміє, що тезаурусповинен бути збільшений, то принаймні цій жінці з ним доведеться несолодко.

Багатий тезаурус, заснований на істинному знанні, дозволяє людині у спілкуванні з іншою людиною, в тому числі і в найближчому спілкуванні з найближчою людиною, правильно реагувати на все, що не станеться.

Очевидно, що зниження цінності інформації зі зростанням тезаурусумає залежати від відношення тезаурусудо кількості отриманої інформації.

Очевидно, що оптимальна цінність художньої інформації відповідає близькості тезаурусучитача та тезаурусупоета.

Можна сказати, що співтворчість, подібно до творчості, вимагає натхнення, тобто включення тезаурусуу сенсі цього терміну.

Таке внутрішнє повторення яскравої образності та яскравого звучання, залишаючись у межах наявного тезаурусу, Збагачує його тим самим естетичним моментом повтору.

У цьому пункті тезаурусуантиподами Платонова треба було б вважати Набокова та Пришвіна, а подібним до нього можна визнати Марину Цвєтаєву.

кафедри ТАОІ КемГУКІ

Інформаційно-пошукові тезауруси:

структура, призначення та порядок розробки

1. Тезаурус як спосіб систематизованого уявлення знань та

різновид ідеографічного словника.

2. Інформаційно-пошукові тезауруси: сутність та призначення

3. Структура ІПТ

4. Порядок розробки, експертизи, реєстрації та ведення ІПТ.

Список літератури

1. ГОСТ 7.74 - 96. Інформаційно-пошукові мови. Терміни та визначення [Текст]. - Введ. 1997-07-01. - Мінськ: Міждержавна рада зі стандартизації, метрології та , 1997. - 34 с. (Система стандартів з інформації бібліотечної та видавничої справи) ТК 191.

2. ГОСТ 7.25-2001. Тезаурус інформаційно-пошуковий одномовний. Правила розробки, структура та форма подання [Текст]. - ГОСТ 7.25-80; Введ. 2002-07-01. - М.: ІПК Вид-во стандартів, 2001. - 16 с. МТК 191.

3. ГОСТ 7.24-2007 Тезаурус інформаційно-пошуковий багатомовний. Склад, структура та основні вимоги до побудови. - Замість ГОСТ 7.24-90; введ. 2008-07-01. / Міждержавна рада зі стандартизації, метрології та сертифікації. - М.: Стандартінформ, 2008. - 7 с. (Система стандартів з інформації, бібліотечної та видавничої справи)

4. Баранов, О. С. Ідеографічний словник російської мови / О. С. Баранов. - М.: Видавництво ЕТС, 1995. - 820 c

5. Жмайло, С. В. До питання про визначення тезаурусу [Текст] / С. В. // НТІ. Сер. 1 Організація та інформаційної роботи. - 2003. - №12. - С.20 - 25.

6. Жмайло, С. В. До розробки сучасних інформаційно-пошукових тезаурусів [Текст] / С. В. Жмайло // НТІ. Сер. 1 Організація та методика інформаційної роботи. -2004. - №1. - С.23 - 31.

Так, в ідеографічному словнику російської мови О. С. Баранова (4) виділено 12 вищих розділів ідеографічного словника, серед яких: «порядок, природа, діяльність, культура» та ін., кожен з яких поділяється на групи, підгрупи, відділи, розділи . Всі слова в цьому словнику зібрані в гнізда за змістом і групуються певного поняття, з яким вони пов'язані найчастіше видовими стосунками. Гнізда у свою групуються у підрозділи тощо. На даний момент у словнику 5923 гнізд, 7 рівнів поділу (за даними www.rifmovnik.ru/thesaurus.htm на 16.02.2010 р.). Наведемо приклад словникової статті із цього словника:

178.4.7 аромат ▲ - приємний запах (наприклад, запах квітів, трави, сіна. ніжний #. п'янкий #). ароматизація. . . амбре. фіміам.

Код слова "аромат" відображає прийняту в даному ідеографічну класифікацію, зокрема, співвіднесеність цього слова з категорією "178 - Відчуття".

Отже, терміни «тезаурус», «ідеографічний словник», «словник типу тезаурус», насамперед означають, що сукупність слів мови у яких представлена ​​в такий спосіб, що у одну групу слів входять слова, близькі за змістом. Основне призначення ідеографічних словників – сукупності лексичних одиниць, об'єднаних загальним поняттям; це полегшує читачеві найбільш підходящих засобів для адекватного вираження думки та сприяє активному володінню мовою.

З історії тезаурусів

КУРТКИ 2302

у Вироби костюмні

Вироби пальтові

Вироби швейні

н Куртка двобортна

Куртка комбінована

Куртка спортивна

Мери пакувальні

Залишки матеріалу

Відходи матеріалу

Лексична примітка;

Аскриптори або дескриптори-синоніми;

Вищі дескриптори;

Нижчі дескриптори;

Асоціативні дескриптори;

Дескриптори, пов'язані з іншими видами відносин.

Усередині кожної групи ЛЕ, пов'язаних із великим дескриптором одним видом парадигматичних відносин, має бути алфавітний порядок розташування. Наприклад:

АЛГОРИТМІЧНІ МОВИ

з мови алгоритмічні

машиноорієнтовані мови

проблемноорієнтовані мови

у ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ

ФОРМАЛЬНІ МОВИ

н АВТОКОДИ

а Алгоритми

ПРОГРАМУВАННЯ СР штучні мови

Аскрипторна стаття складається з аскриптора і дескрипторів, що замінюють його при обробці та пошуку інформації, або комбінації дескрипторів. Наведемо приклади аскрипторних статей:

Алфавітно-цифрові знаки

ісп а ФОРМАЛЬНІ МОВИ

ПРИРОДНІ МОВИ

см АЛГОРИТМІЧНІ МОВИ

Словникова стаття може також включати:

Частоту використання дескриптора;

Кодовий номер дескриптора;

Код дескриптора за систематичним покажчиком;

Класифікаційні індекси;

Додаткові семантичні та лексикографічні посліди;

Іншомовні еквіваленти.

Якість лексико-семантичного покажчика визначається повнотою включених до нього лексичних одиниць. розуміється як ймовірність входження в тезаурус будь-якого інформативно-значущого слова для цієї тематичної галузі. Повнота лексико-семантичного покажчика, отже, і всього тезауруса надає істотне результати індексування документів і запитів.

Додаткові частини можуть включати до свого складу систематичний, пермутаційний, ієрархічний та інші покажчики та списки спеціальних категорій лексичних одиниць.

Систематичний покажчик – це покажчик, у якому дескриптори згруповані згідно з прийнятою в ІПТ рубрикації. Систематичний покажчик визначає тематичний напрямок тезауруса, розкриває його зміст і відбиває ті галузі науки і техніки, якими можна з тією чи іншою глибиною деталізації проводити пошук. Необхідність його як частини ІПТ обумовлена ​​тим, що він дає наочне уявлення про загальний стан термінології в тій чи іншій галузі знань, дозволяє побудувати струнку термінологічну модель та по можливості всі терміни та поняття, які мають знайти місце у тезаурусі. Він призначений для полегшення пошуку термінів при складанні пошукових образів документів та запитів шляхом упорядкування безлічі дескрипторів та аскрипторів за предметною ознакою.

Систематичний покажчик, сутнісно, ​​є класифікаційну схему наповнення тезауруса термінологією, оскільки він будується шляхом упорядкування безлічі дескрипторів по предметно-тематичним областям.

Систематичні покажчики ІПТ поділяють на три типи:

Тематичні,

Змішані.

Такий поділ відбиває принцип побудови класифікаційної схеми систематичного покажчика.

Основні функції, що виконуються систематичним покажчиком ІПТ:

Використання як допоміжне при індексуванні, що забезпечує, всього, пошуку дескрипторів для індексування понять, не представлених у тезаурусі у явному вигляді (пошукова функція);

Використання у процесі ведення тезаурусу (функція ведення ІПТ);

Використання як структурну основу ІПТ, як управління його розробкою (конструктивна функція).

Відповідно до ГОСТ 7.25-2001 (2) при побудові систематичного покажчика тематичного та змішаного типів у його тематичній частині слід використовувати рубрики Міждержавного рубрикатора НТІ або рубрикатора конкретної АСНТІ, сумісного з Міждержавним рубрикатором НТІ. При побудові систематичного покажчика категоріального та змішаного типів у його категоріальній частині слідують такі загальні категорії:

Назви дисциплін та галузей діяльності;

Предмети, матеріали;

Методи, процеси, операції, явища;

властивості, величини, параметри, характеристики;

Відносини, структури, моделі, закони, правила, абстрактні поняття.

Ієрархічний покажчик. Ієрархічний покажчик – покажчик, у якому дано перелік списків дескрипторів, причому кожен список починається з дескриптора, який має вищестоящих. Він відбиває повну структуру ієрархічних відносин ІПТ. Після кожного дескриптора наведено безпосередньо дескриптори із зазначенням їх рівня в ієрархії шляхом застосування нумерації або графічного позначення рівня:

Необхідність розробки ієрархічного покажчика ІПТ буває викликана тим, що у словникових статтях ІПТ не закріплюється всю систему підпорядкованості понять, т.к. це спричинило б значне збільшення лексико-семантичного покажчика. виникає необхідність розробки самостійного розділу ІПТ – ієрархічного покажчика, який би відображав весь ієрархічний ланцюжок підпорядкованості дескрипторів до низу.

Пермутаційний покажчик – покажчик, у якому в алфавітному порядку перераховані всі окремі слова, що входять до компонентів словосполучень, що позначають дескриптори і для кожного з них вказані всі дескриптори, до складу яких входять ці слова. Отже, кожен термін зустрічається в пермутаційному покажчику стільки разів, скільки слів він містить. Призначення пермутаційного покажчика – забезпечувати пошук дескрипторів-словосполучень за будь-яким словом, що входить до їх складу, у тому числі й за тими, що не стоять на початку лексичної одиниці. Він дозволяє групувати одному місці однокореневі слова.

Як правило, пермутаційний покажчик складається автоматизованим способом і зазвичай має вид покажчика типу KWIC (Key Word – In Context – «Ключові слова в контексті»), в якому всі значущі слова – термінів – розташовуються в алфавітному порядку. в пермутаційний покажчик знаходиться в центрі колонки, яку утворюють мікроконтексти елементів термінів, а частина термінів, що не змістилася, переноситься в ліву частину того ж рядка:

оптичні квантові

збудження

електричні

із залежним збудженням

Генератори перешкод

Генератори послідовного

Генератори постійного струму

ГЕНЕРАТОРИ постійного струму виявитися необхідними.

4.Порядок розробки, експертизи, реєстрації та ведення ІПТ

В даний час порядок розроблення, експертизи та реєстрації ІПТ визначається двома стандартами: ГОСТ 7.25-2001 «Тезаурус інформаційно-пошуковий одномовний. Правила розробки, структура, склад та форма подання» та ГОСТ 7.24-2007 «Тезаурус інформаційно-пошуковий багатомовний. Склад, структура та основні вимоги до побудови». Відповідно до цих стандартів функції експертизи та реєстрації ІПТ виконують національний та міжнародний депозитарні фонди.

Національний депозитарний фонд ІПТ російською мовою (включаючи ІПТ, що містять еквіваленти дескрипторів російською мовою) знаходиться у ВІНІТІ.

Існує також два міжнародні депозитарні ІПТ:

1) міжнародний депозитарний фонд ІПТ англійською мовою, включаючи ІПТ, що містять еквіваленти дескрипторів англійською мовою. Він знаходиться в , в м. Торонто, в бібліотеці факультету інформаційних наук Університету в Торонто (Thesaurus Clearinghouse - "розрахункова", The Library, Faculty of Information Studies, University of Toronto, TORONTO, Canada);

2) міжнародний депозитарний фонд ІПТ усіма іншими мовами, крім англійської. Він знаходиться в , у Варшаві, у науковій та техніко-економічній інформації (Instytut Informacji Naukowej, Technicznej i Ekonomicznej, Clearinghouse, WARSZAW A, Poland.).

Повні адреси цих організацій наводяться у ГОСТ 7.25-2001.

ГОСТ 7.25-2001 та ГОСТ 7.24-2007 визначають дій розробників ІПТ наступним чином:

1. До початку робіт зі створення ІПТ розробник повинен звернутися до відповідного національного або міжнародного депозитарного фонду з метою визначення наявності зареєстрованих тезаурусів за заданою тематикою. За наявності таких тезаурусів проводять оцінку можливості впровадження їх у цій системі. Якщо такі тезауруси не виявлені, може створити ІПТ. При цьому вся технологія створення ІПТ повинна суворо відповідати ГОСТ 7.25-2001 і ГОСТ 7.24-2007

2. Готові (розроблені) ІПТ повинні пройти експертизу на відповідність ГОСТ 7.25-2001. вони відповідають стандарту, то Національний видає розробнику. цього ІПТ депонується (здається на зберігання) у відповідному національному чи одному з міжнародних депозитарних фондах (у Торонто чи Варшаві).

Національні депозитарії розповсюджують інформацію про склад фонду депонованих ІПТ та надають їх розробникам нових ІПТ з метою запозичення елементів та забезпечення сумісності лінгвістичного забезпечення різних інформаційних систем. Таким чином, вони виконують функції експертизи, реєстрації, зберігання ІПТ та інформування про наявні ІПТ.

Багато операцій з ведення ІПТ);

Перехід АІС від незалежного функціонування до роботи в режимі мережі (при використанні ІПТ у рамках єдиної засади їх ведення мають бути узгоджені).

Процедура підтримки ІПТ у робочому стані називається веденням чи коригуванням тезаурусу. Зазвичай вона включає такі:

Зміна лексичного складу ІПТ: внесення нових лексичних одиниць, їх зміна статусу лексичних одиниць (переведення ключового слова в дескриптори і навпаки);

Зміна парадигматичних відносин в ІПТ (посилення, ослаблення);

Ведення ІПТ передбачає обов'язкове використання засобів автоматизації, що дозволяють оперативно проводити такі трудомісткі операції, як алфавітне сортування словника, лексики, перевірка взаємності та несуперечності посилань, за допомогою яких ІПТ фіксуються парадигматичні відносини та ін.

Все частіше у численних проектах, книгах, брошурах, інтернет-ресурсах можна зустріти поняття "тезаурус". Немов таємниче явище воно лякає своєю незвіданістю, адже куди простіше сказати "словник", ніж використовувати дивне визначення.

Тезаурус: що це? Чим він відрізняється від звичайного словника? Спробуємо вивчити ці питання докладніше і доступніше.

Трактування терміну

Спочатку поняття тезауруса розглядалося з погляду словника, що представляв лексику мови з прикладами вживання у тексті.

Ожегов трактує тезаурус як словник конкретної мови, який відбиває лексику повною мірою, тоді як Єфремова розглядає даний феномен з погляду систематизованого набору даних у галузі знання.

Найбільш конкретне визначення використовується у філології, там під тезаурусом розуміється компонент словникового типу, де всі значення слів пов'язані семантичними відносинами між собою та відображають ключові співвідношення понять у певній предметній галузі.

Як бачимо, досить складно відповісти питанням: " Тезаурус: що це?" однозначно. Для більш вузького вивчення терміна розглянемо історію виникнення, види та відносини лексичних одиниць у словнику такого типу.

Історія виникнення

Батьком-засновником тезаурусів вважається англійський фізик Роже, саме він у 1852 р. систематизував розподіливши її за групами. При цьому кожна група була представлена ​​назвою поняття, а далі йшли його синоніми за певними частинами мови, списки споріднених найменувань, а також посилання до імен інших категорій. Ідея такої класифікації була дуже цінною, оскільки словник вважався найприроднішим, описував лексику мови у повній мірі. При цьому він міг бути застосований як швидкий пошук важливих понять. З часів першого тезаурусу і досі відбувається регулярна трансформація даного типу словника, який застосовується в багатьох галузях знань та користується широкою популярністю в усьому світі. У цьому вивчення теми: «Тезаурус: що це?» актуально у багатьох навчальних закладах.

Дотепер тезауруси залишаються найбільш популярним способом опису знань у будь-якій галузі, необхідної для ефективного сприйняття людиною.

Відносини слів у тезаурусі

Найпоширенішими відносинами у класичному тезаурусі вважаються:

  1. Синонімія - явище, у якому пов'язуються слова однієї частини мови, подібні за лексичним значенням. Наприклад: держава-вітчизна, бригада-загін, червоний - червонийі т.д.
  2. Антонімія – зв'язок слів однієї частини мови, що мають протилежне лексичне значення. Наприклад: тиша - гуркіт, лагідний - грубий.
  3. Гіперонімія (гіпонімія) – ключові відносини з метою опису іменників. Гіперонім має широке лексичне значення, виражає родове, загальне найменування класу (множини) об'єктів, предметів, саме його властивостей і ознак. Гіпонім має вузьке значення, він називає предмет (ознака, властивість) як елемент конкретної множини або класу. Для того, щоб ці відносини стали зрозумілими, наведемо найпростіший приклад. Слова звір та тигрпов'язані між собою, при цьому загальна назва - звір- є гіперонімом по відношенню до гіпоніму тигр.
  4. Меронімія (партонімія) – відносини для іменників, складаються за принципом «частина – ціле». Як приклад розглянемо слова літак, шасі, ілюмінатор. У разі загальне найменування транспорту - холоним (ціле, ім'я), яке складові - меронимы.
  5. Наслідок (відносини між дієсловами). Наприклад, слова йти та прийтипов'язані процесом та його наслідком (результатом).
  6. Причина (також припустимо лише для дієслів). Розглянемо приклад таких відносин, візьмемо слова: хворіти - пропустити. У цьому випадку простежується причина – пропустити, бо були проблеми зі здоров'ям.

Що тезаурус є, побачимо з наступного прикладу.

Ліжко - пристрій для сну.

[гіперонім]: меблі
[меронім]: будинок
[Синонім]: лежанка, полоті.

Це лише класичний приклад тезаурусу російської, проте всі словники даного типу будуються саме за таким принципом.

Функції тезаурусу

Словник-тезаурус несе важливі соціальні, комунікаційні, наукові та інші функції.

Він являється:

  • джерелом спеціальних знань у широкій чи вузькій предметної області, методом упорядкування, описи термінів ;
  • інструментом пошуку інформаційному потоці;
  • інструментом ручного аналізу документації у пошукових системах;
  • інструмент автоматичного індексування складних текстів.

Види тезаурусів

Різноманітність словників вимагає розглядати як питання: " Тезаурус: що це? " , а й звертати увагу до види. Це допоможе нам краще засвоїти особливості цього типу словників.


Висновок

Ми сподіваємося, що змогли доступною мовою пояснити, що таке тезаурус. Завдяки прикладам легко зрозуміти, чим він відрізняється від решти словників. Також ми висвітлили питання про інформаційно-пошукові тезауруси, які широко використовуються інформаційною системою для швидкого пошуку та систематизації мільйонів найменувань.



Подібні публікації