Семантическая сеть

Пример семантической сети

Семанти́ческая сеть — информационная модель предметной области, имеет вид ориентированного графа. Вершины графа соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть: понятия, события, свойства, процессы[1]. Таким образом, семантическая сеть — это один из способов представления знаний.

В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа — набора вершин, соединённых дугами (рёбрами), которым присвоено некоторое число. В семантической сети роль вершин выполняют понятия базы знаний, а дуги (причем направленные) задают отношения между ними. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений.

Неправильно приравнивать друг другу понятия «Семантическая сеть» (англ. Semantic Network) и «Семантическая паутина» (англ. Semantic Web). Хотя эти понятия не эквивалентны, тем не менее, они связаны (см. ниже).

История

Идея систематизации на основе каких-либо семантических отношений предлагалась ещё учёными ранней науки. Примером этого может служить биологическая классификация Карла Линнея 1735 г. Если рассматривать её как семантическую сеть, то в данной классификации используется отношение подмножества, современное AKO (от англ. «A Kind Of», «разновидность»).

Прародителями современных семантических сетей можно считать экзистенциальные графы, предложенные Чарльзом Пирсом в 1909 г. Они использовались для представления логических высказываний в виде особых диаграмм. Пирс назвал этот способ «логикой будущего».

Важным направлением в исследовании сетей стали работы немецкого психолога Отто Зельца 1913 и 1922 гг. В них для организации структур понятий и ассоциаций, а также изучения методов наследования свойств он использовал графы и семантические отношения. Исследователи М. Андерсон (1973), Д. Норман (1975) и другие использовали эти работы для моделирования человеческой памяти и интеллектуальных свойств.

Компьютерные семантические сети были детально разработаны Ричардом Риченсом (англ.) в 1956 году в рамках проекта Кембриджского центра изучения языка по машинному переводу. Процесс машинного перевода подразделяется на 2 части: перевод исходного текста в промежуточную форму представления, а затем эта промежуточная форма транслируется на нужный язык. Такой промежуточной формой как раз и были семантические сети. В 1961 г. появилась работа Мастерман (англ.), в которой она, в частности, определяла базовый словарь для 15000 понятий. Эти исследования были продолжены Робертом Симмонсом (1966), Й. Уилксом (1972) и другими учёными.

Труды по семантическим сетям часто ссылаются на работу американского психолога Росса Квиллиана (Quillian) о «семантической памяти»[2].

Структура

Математика позволяет описать большинство явлений в окружающем мире в виде логических высказываний. Семантические сети возникли как попытка визуализации математических формул. Основным представлением для семантической сети является граф. Однако не стоит забывать, что за графическим изображением непременно стоит строгая математическая запись и что обе эти формы отображают одно и то же.

Графическое представление

Основной формой представления семантической сети является граф. Понятия семантической сети записываются в овалах или прямоугольниках и соединяются стрелками с подписями — дугами (см. рис.). Это наиболее удобно воспринимаемая человеком форма. [источник не указан 4661 день] Её недостатки проявляются, когда мы начинаем строить более сложные сети или пытаемся учесть особенности естественного языка. Схемы семантических сетей, на которых указаны направления навигационных отношений, называют картами знаний, а их совокупность, позволяющая охватить большие участки семантической сети, атласом знания.

Математическая запись

В математике граф представляется множеством вершин V и множеством отношений между ними E. Используя аппарат математической логики, приходим к выводу, что каждая вершина соответствует элементу предметного множества, а дуга — предикату.

Лингвистическая запись

В лингвистике отношения фиксируются в словарях и в тезаурусах. В словарях в определениях через род и видовое отличие родовое понятие занимает определённое место. В тезаурусах в статье каждого термина могут быть указаны все возможные его связи с другими родственными по теме терминами. От таких тезаурусов необходимо отличать тезаурусы информационно-поисковые с перечнями ключевых слов в статьях, которые предназначены для работы дескрипторных поисковых систем.

Классификация семантических сетей

Для всех семантических сетей справедливо разделение по арности и количеству типов отношений.

  • По количеству типов отношений, сети могут быть однородными и неоднородными.
    • Однородные сети обладают только одним типом отношений (стрелок), например, таковой является вышеупомянутая классификация биологических видов (с единственным отношением AKO).
    • В неоднородных сетях количество типов отношений больше одного. Классические иллюстрации данной модели представления знаний представляют именно такие сети. Неоднородные сети представляют больший интерес для практических целей, но и большую сложность для исследования. Неоднородные сети можно представлять как переплетение древовидных многослойных структур. Примером такой сети может быть Семантическая сеть Википедии.
  • По арности:
    • типичными являются сети с бинарными отношениями (связывающими ровно два понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде стрелки между двух концептов. Кроме того, они играют исключительную роль в математике.
    • На практике, однако, могут понадобиться отношения, связывающие более двух объектов — N-арные. При этом возникает сложность — как изобразить подобную связь на графе, чтобы не запутаться. Концептуальные графы (см. ниже) снимают это затруднение, представляя каждое отношение в виде отдельного узла.
  • По размеру:
    • Для решения конкретных задач, например, тех, которые решают системы искусственного интеллекта.
    • Семантическая сеть отраслевого масштаба должна служить базой для создания конкретных систем, не претендуя на всеобщее значение.
    • Глобальная семантическая сеть. Теоретически такая сеть должна существовать, поскольку всё в мире взаимосвязано. Возможно, когда-нибудь такой сетью станет Всемирная паутина.

Помимо концептуальных графов существуют и другие модификации семантических сетей, это является ещё одной основой для классификации (по реализации). См. более подробно в соответствующем разделе ниже.

Семантические отношения

Количество типов отношений в семантической сети определяется её создателем, исходя из конкретных целей. В реальном мире их число стремится к бесконечности. Каждое отношение является, по сути, предикатом, простым или составным. Скорость работы с базой знаний зависит от того, насколько эффективно реализованы программы обработки нужных отношений.

Иерархические

Наиболее часто возникает потребность в описании отношений между элементами, множествами и частями объектов. Отношение между объектом и множеством, обозначающим, что объект принадлежит этому множеству, называется отношением классификации (ISA). Говорят, что множество (класс) классифицирует свои экземпляры.[3] (пример: «Шарик является собакой» = Шарик является объектом типа собака). Иногда это отношение именуют также MemberOf, InstanceOf или подобным образом. Связь ISA предполагает, что свойства объекта наследуются от множества. Обратное к ISA отношение используется для обозначения примеров, поэтому так и называется — «Example», или по-русски «Пример». Иерархические отношения образуют древовидную структуру.

  • Отношение между надмножеством и подмножеством (называется AKO — «A Kind Of», «разновидность»). (Пример: «собака является животным» = тип с именем собака является подтипом типа животные). Элемент подмножества называется гипонимом (собака), а надмножества — гиперонимом (животное), а само отношение называется отношением гипонимии. Альтернативные названия — «SubsetOf» и «Подмножество». Это отношение определяет, что каждый элемент первого множества входит и во второе (выполняется ISA для каждого элемента), а также логическую связь между самими подмножествами: что первое не больше второго и свойства первого множества наследуются от второго. Отношение АКО (Род-Вид) часто используется для навигации в информационном пространстве.
  • Объект, как правило, состоит из нескольких частей, или элементов. Например, компьютер состоит из системного блока, монитора, клавиатуры, мыши и т. д. Важным отношением является HasPart, описывающее связь частей и целого — отношение меронимии. В этом случае свойства первого множества не наследуются вторым. Мероним и холоним — противоположные понятия:
    • Мероним — объект, являющийся частью для другого. (Двигатель — мероним автомобиля.)
    • Холоним — объект, который включает в себя другое. (Например, у дома есть крыша. Дом — холоним крыши. Компьютер — холоним монитора.)

Часто в семантических сетях требуется определить отношения синонимии и антонимии. Эти связи либо дублируются явно в самой сети, либо определяются алгоритмической составляющей.

Вспомогательные

В семантических сетях часто используются также следующие отношения[источник не указан 1616 дней]:

  • функциональные связи (определяемые обычно глаголами «производит», «влияет»…);
  • количественные (больше, меньше, равно…);
  • пространственные (далеко от, близко от, за, под, над…);
  • временные (раньше, позже, в течение…);
  • атрибутивные (иметь свойство, иметь значение);
  • логические (И, ИЛИ, НЕ);
  • лингвистические.

Этот список может сколь угодно продолжаться: в реальном мире количество отношений огромно. Например, между понятиями может использоваться отношение «совершенно разные вещи» или подобное: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Особенности использования некоторых типов отношений

В семантической сети в качестве понятий могут быть как экземпляры объектов, так и их множества. Использование одних и тех же отношений и для элементов, и для коллекций может привести к недоразумениям. Подобные ошибки в работе некоторых первых систем были описаны в статье Дрю Макдермотта[англ.] «Искусственный интеллект сталкивается с естественной глупостью».

Рассмотрим пример — четыре предложения:

  1. У Павла есть отец по имени Алексей.
  2. Для Павла найдётся отец из множества мужчин.
  3. Найдется человек, для которого Алексей — отец.
  4. У каждого человека есть отец из множества мужчин.

Для человека ясен смысл этих фраз и многие не задумываясь поставили бы во всех четырёх случаях отношение есть отец. Однако это является ошибкой: в первом случае, действительно, описывается отношение между двумя экземплярами, но во втором и третьем — между экземпляром и множеством, а в четвёртом — отношение между представителями из двух множеств. В математической записи это выглядит так, соответственно для предложений 1—4:

  I.  ∃ павел & ∃ алексей : отец(алексей, павел);
 IIа. ∃ павел → ∃ x ∈ мужчины : отец(x, павел);
 IIб. ∃ алексей → ∃ y ∈ люди : отец(алексей, y);
III.  ∀ y ∈ люди → ∃ x ∈ мужчины : отец(x, y);

Мы видим, что случаи IIа и IIб различаются только порядком следования переменных в предикате, однако для правильности сети это может сыграть важную роль. В примере перечислены лишь 4 рода отношений, всего же для бинарной сети их существует девять. Они различаются кванторами ∃ и ∀, а также порядком переменных.

Графически для отличия всех этих случаев применяют специальные форму пометок отношений на графе: например, отношения первого рода оставляют без изменений, второго — обводят прямоугольной рамкой из точек, третьего — тире, а четвёртого — тире-точка. Либо можно просто написать рядом индекс типа отношения.

Наиболее часто встречающаяся путаница возникает насчёт отношения ISA. Поэтому во многих современных работах принимается, что ISA обозначает связь между экземпляром и множеством (вышеописанный случай IIб): Мурка ISA кошка. Одиночная рамка при этом не используется. Если требуется определить отношение эквивалентности (случай I), для этого может вводиться специальное отношение (хотя для семантической сети нужда в нём небольшая). ISA можно использовать для обозначения вхождения элементов одного множества в другое (случай III), однако так делать не рекомендуется. Для обозначения подмножеств применяется ещё одно специальное отношение — AKO. Различие между «ISA в рамке» и AKO заключается в том, что последнее отвечает ещё и за наследование свойств самих множеств, а не только элементов.

Использование семантических сетей

Семантизация

Семантизация — процесс изменения текстов, в которых выделяются семантические отношения без изменения их содержания. В Википедии существуют проекты по семантизации статей и Дерева категорий.

  • Семантизация статей производится, в основном, путём использования шаблонов, при этом некоторые категории создаются автоматически.
  • Семантизация Дерева категорий заключается в соблюдении транзитивности, создании метакатегорий и организации структуры подкатегорий, используя значимые критерии.

Семантическая паутина

Концепция организации гипертекста напоминает однородную бинарную семантическую сеть, однако здесь есть существенное отличие:

  1. Связь, осуществляемая гиперссылкой, не имеет семантики, то есть не описывает смысла этой связи. Назначение семантической сети состоит в том, чтобы описать взаимосвязи объектов, а не дополнительную информацию по предметной области. Человек может разобраться, зачем нужна та или иная гиперссылка, но компьютеру эта связь не понятна.
  2. Страницы, связываемые гиперссылками, являются документами, описывающими, как правило, проблемную ситуацию в целом. В семантической сети вершины (то, что связывают отношения) представляют собой понятия или объекты реального мира.

Попытка создания семантической сети на основе Всемирной паутины получила название семантической паутины. Эта концепция подразумевает использование языка RDF (языка разметки на основе XML) и призвана придать ссылкам некий смысл, понятный компьютерным системам. Это позволит превратить Интернет в распределённую базу знаний глобального масштаба.

Программное обеспечение

См. также

Примечания

  1. Roussopoulos N.D. A semantic network model of data bases. — TR No 104, Department of Computer Science, University of Toronto, 1976.
  2. Quillian, M. R. (1968). Semantic memory. Semantic information processing, 227—270.
  3. Основные понятия. Дата обращения: 15 апреля 2007. Архивировано 25 января 2007 года.

Read other articles:

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: List of territorial disputes – news · newspapers · books · scholar · JSTOR (May 2021) (Learn how and when to r…

This list of Mac models grouped by CPU type contains all central processing units (CPUs) used by Apple Inc. for their Mac computers. It is grouped by processor family, processor model, and then chronologically by Mac models. Motorola 68k Motorola 68000 A Motorola 68000 processor in a dual in-line package, as the early Macintosh models used The Motorola 68000 was the first Apple Macintosh processor. It has 32-bit CPU registers, a 24-bit address bus, and a 16-bit data path; Motorola referred to it…

Arab historiographer and historian (1332–1406) For the horse, see Ibn Khaldun (horse). Ibn KhaldunBust of Ibn Khaldun in the entrance of the Kasbah of Bejaia, AlgeriaPersonalBorn27 May 1332Tunis, Hafsid SultanateDied17 March 1406 (1406-03-18) (aged 73)Cairo, Mamluk SultanateReligionIslamDenominationSunni[1]JurisprudenceMaliki[2]CreedAsh'ari[3][4]Main interest(s)Historiographysociologyeconomicsdemographypolitical scienceNotable idea(s) Asabiyyah Conques…

Ahmedabad MetroInfoPemilikGujarat Metro Rail Corporation LimitedJenisRapid transitJumlah jalur2 (fase-1)[1]2 (fase-2)Jumlah stasiun29 (Operasional)32 (Fase-1)22 (Fase-2)Penumpang harian30.000 [2]Pimpinan utamaDurga Shanker MishraKantor pusatBlock No.1, First Floor, Karmayogi Bhavan, Sector 10/A, Gandhinagar-382010[3]Situs webGujarat MetroOperasiDimulai4 Mar 2019 (6 stasiun), 2 Oct 2022 (15 stasiun, Koridor Timur-Barat), 6 Okt 2022 (15 stasiun, koridor utara-selatan)Akan d…

Unit of volume with numerous different definitions This article is about the units of measurement. For surnames and other uses, see Bushell and Scheffel (disambiguation). This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Bushel – news · newspapers · books · scholar · JSTOR (December 2009) (Learn how and when to r…

Measure of air pollutionAn annotated satellite photo showing smoke from wildfires in Greece, giving rise to an elevated AQI downwind Part of a series onPollutionAir pollution from a factory Air Air quality index Atmospheric dispersion modeling Chlorofluorocarbon Combustion Exhaust gas Haze Global dimming Global distillation Indoor air quality Ozone depletion Particulates Persistent organic pollutant Smog Soot Volatile organic compound Waste Biological Biological hazard Genetic Introduced species…

Califat fatimide(ar) الدولة الفاطمية (ber) ⵜⴰⵎⵏⴽⴷⴰ ⵏ ⵉⴼⴰⵟⵎⵉⵢⵏ 909–1171Le vert[1] et le blanc[2] furent utilisés par la dynastie des Fatimides. Informations générales Statut Califat, Empire Capitale Raqqada / Kairouan (909-918)Mahdia (918[3]-969)al-Qâhira (969-1171) Langue(s) Arabe Religion Islam chiite Monnaie Dinar et dirham Superficie Superficie (969[4]) 4 100 000 km2 Histoire et événements 909 Établissement 969 Conquête de…

Ongoing COVID-19 viral pandemic in Angola COVID-19 pandemic in AngolaDiseaseCOVID-19Virus strainSARS-CoV-2LocationAngolaFirst outbreakWuhan, Hubei, ChinaIndex caseLuandaArrival date21 March 2020(4 years, 2 months, 3 weeks and 1 day)Confirmed cases107,454[1]Recovered63,295[2][3]Deaths1,937[1]Fatality rate1.8%Vaccinations16,522,932[1] (total vaccinated)9,591,203[1] (fully vaccinated)27,722,924[1] (doses administered)Govern…

Style of ballroom dance This article is about the ballroom dance. For other musical styles, see Rumba. RhumbaStylistic originsSon cubano, American ballroom musicCultural originsEast Coast of the United States, early 1930sTypical instrumentsVocals, trumpet, saxophone, trombone, guitar, piano, violin, bass, maracas, congas, bongos, timbales, drumsSubgenresBallroom congaRegional scenesNew York City Rhumba, also known as ballroom rumba, is a genre of ballroom music and dance that appeared in the Eas…

The 107th United States Congress began on January 3, 2001. There were eleven new senators (nine Democrats, two Republicans) and 41 representatives (28 Republicans, 13 Democrats), as well as one new delegate (a Democrat) at the start of the first session. Additionally, four senators (three Republicans, one third party member) and nine representatives (three Democrats, six Republicans) took office on various dates in order to fill vacancies during the 107th Congress before it ended on January 3, 2…

Late Roman solar deity This article is about the Roman sun god. For other uses of Sol Invictus, see Sol Invictus (disambiguation). Sol InvictusGod of the sunA relief of Sol from Roman Lugdunum, 2nd–3rd century CEOther namesElagabalusMajor cult centerTemple of the SunAbodeThe skyPlanetSunSymbolsSunburst, halo, radiate crownDaySundayGenderMaleFestivalsDies Natalis Solis Invicti (25th December)EquivalentsGreek equivalentHeliosPalmyran equivalentUtu Sol Invictus (Classical Latin: [ˈsoːɫ ɪn…

Untuk kegunaan lain, lihat Cinta dan Rahasia. Artikel ini bukan mengenai Rahasia dan Cinta. Cinta dan RahasiaGenre Drama Roman SutradaraYoyok DumprinkLagu pembukaCinta dan Rahasia - Yura Yunita feat. Glenn FredlyLagu penutupCinta dan Rahasia - Yura Yunita feat. Glenn FredlyNegara asalIndonesiaJmlh. musim2Jmlh. episode110ProduksiPengaturan kameraMulti-kameraDurasi60 menitRumah produksiLimelight PicturesDistributorIndika GroupRilis asliJaringanNET.Format gambarHDTV (1080i 16:9)Format audioDolby Di…

Een regeringsvorm beschrijft de manier waarop een overheidsverband geregeerd wordt of misschien zou kunnen worden. In het algemeen gaat het hierbij om staten of landen, maar het is ook mogelijk de regeringsvorm van supranationale organisaties of decentrale overheden te beschrijven. Regeringsvorm en staatsvorm Van regeringsvorm moet staatsvorm onderscheiden worden. Met de staatsvorm bedoelen we niet de wijze waarop betrekkingen tussen verschillende ambten binnen één overheidsverband zijn gerege…

Disambiguazione – Se stai cercando la chiesa di Piazza del Monastero, sempre a Torino, vedi Chiesa della Visitazione (Torino, Parella). Chiesa della VisitazioneFacciataStato Italia RegionePiemonte LocalitàTorino Coordinate45°03′58.72″N 7°40′47.53″E45°03′58.72″N, 7°40′47.53″E ReligioneCristiana cattolica di rito romano TitolareVisitazione della Beata Vergine Maria Arcidiocesi Torino ArchitettoFrancesco Lanfranchi Stile architettonicobarocco Completamento1660 Modifica d…

1964 in music By location Canada United Kingdom Norway By genre country jazz By topic List of albums released Overview of the events of 1964 in music List of years in music (table) … 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 … In radio 1961 1962 1963 1964 1965 1966 1967 In television 1961 1962 1963 1964 1965 1966 1967 In film 1961 1962 1963 1964 1965 1966 1967 Art Archaeology Architecture Literature Music Philosophy Science +... …

Polistirena sulfonat, suatu resin penukar kation, biasanya tersedia dengan Na+ sebagai ion lawan. Sebuah ion lawan (bahasa Inggris: counterion atau counter ion) adalah ion yang menyertai spesies ion untuk menjaga netralitas listrik. Dalam garam dapur (NaCl), ion natrium (bermuatan positif) adalah ion lawan dari ion klorin (bermuatan negatif) dan sebaliknya. Ion lawan lebih umum dirujuk sebagai anion atau kation, tergantung listriknya. Oleh karena itu, ion lawan dari anion adalah kation, dan …

El extranjero de Albert Camus Género Novela filosóficaTema(s) Filosofía del absurdoAmbientada en Argelia Edición original en francésTítulo original L'ÉtrangerPaís Francia Fecha de publicación 1942 Premios Los 100 libros del siglo según Le Monde Edición traducida al españolTítulo El extranjeroEditorial Éditions GallimardPaís FranciaFecha de publicación 1942Páginas 184Ciclo del absurdoEl extranjeroEl mito de Sísifo[editar datos en Wikidata] El extranjero (en franc…

См. также: Иерусалимский храм и Иерусалим в период Второго Храма Второй храмивр. בֵּית הַמִּקְדָּשׁ‎ הַשֵּׁנִי‎ 31°46′41″ с. ш. 35°14′07″ в. д.HGЯO Тип разрушенное религиозное здание[вд] и культовое сооружение Страна Иудейское царство[1] Местоположение Иер…

Christopher R. Coppola Christopher R. Coppola (25 gennaio 1962) è un regista e produttore cinematografico statunitense. Indice 1 Biografia 2 Filmografia parziale 2.1 Regista 2.2 Produttore 3 Altri progetti 4 Collegamenti esterni Biografia Nato nella contea di Los Angeles (California), è figlio dell'accademico e autore August Coppola e della danzatrice e coreografa Joy Vogelsang. Suoi fratelli sono il DJ e attore Marc Coppola e l'attore e produttore Nicolas Cage. Dalla parte del padre è quindi…

Linn Ullmann Linn Ullmann en 2011. Données clés Naissance 9 août 1966 (57 ans) Oslo Norvège Activité principale romancière Distinctions Prix Dobloug (2017) Auteur Langue d’écriture norvégien Genres roman modifier Linn Ullmann, née le 9 août 1966 à Oslo, est une critique et romancière norvégienne. Biographie Famille et formation Fille du cinéaste Ingmar Bergman et de l'actrice Liv Ullmann[1], Linn Ullmann passe son enfance auprès de sa mère, d'Oslo jusqu'à New York, où el…