Семантическая модель знаний. Семантические базы данных. Семантическая модель «смысл↔текст»

Нормализация

Основная статья: Нормальная форма

При проектировании реляционных баз данных обычно выполняется так называемая нормализация.

Модели «сущность-связь»

Основная статья: ER-модель данных

Модель «сущность-связь» (англ. “Entity-Relationship model” ), или ER-модель, предложенная П. Ченом в 1976 г., является наиболее известным представителем класса семантических (концептуальных, инфологических) моделей предметной области. ER-модель обычно представляется в графической форме, с использованием оригинальной нотации П. Чена, называемой ER-диаграмма , либо с использованием других графических нотаций (Crow"s Foot , Information Engineering и др.).

Основные преимущества ER-моделей:

· наглядность;

· модели позволяют проектировать базы данных с большим количеством объектов и атрибутов;

· ER-модели реализованы во многих системах автоматизированного проектирования баз данных (например, ERWin).

Основные элементы ER-моделей:

· объекты (сущности);

· атрибуты объектов;

· связи между объектами.

Сущность - объект предметной области, имеющий атрибуты.

Связь между сущностями характеризуется:

· типом связи (1:1, 1:N, N:М);

· классом принадлежности. Класс может быть обязательным и необязательным. Если каждый экземпляр сущности участвует в связи, то класс принадлежности - обязательный, иначе - необязательный.

Семантическая модель (концептуальная модель, инфологическая модель) – модель предметной области, предназначенная для представления семантики предметной области на самом высоком уровне абстракции. Это означает, что устранена или минимизирована необходимость использовать понятия «низкого уровня», связанные со спецификой физического представления и хранения данных.

Семантическое моделирование стало предметом интенсивных исследований с конца 1970-х годов. Основным побудительным мотивом подобных исследований (т.е. проблемой, которую пытались разрешить исследователи) был следующий факт. Дело в том, что системы баз данных обычно обладают весьма ограниченными сведениями о смысле хранящихся в них данных. Чаще всего они позволяют лишь манипулировать данными определенных простых типов и определяют некоторые простейшие ограничения целостности, наложенные на эти данные. Любая более сложная интерпретация возлагается на пользователя. Однако было бы замечательно, если бы системы могли обладать немного более широким объемом сведений и несколько интеллектуальнее отвечать на запросы пользователя, а также поддерживать более сложные (т.е. более высокоуровневые) интерфейсы пользователя.
[…]
Идеи семантического моделирования могут быть полезны как средство проектирования базы данных даже при отсутствии их непосредственной поддержки в СУБД.

Наиболее известным представителем класса семантических моделей является модель «сущность-связь» (ER-модель).

Понятие семантической модели

Пусть имеется два множества A и B , тогда функция f однозначно ставящая в соответствие каждому элементу называется отображением множества A на множество B , то есть .

Элемент называется образом элемента a .

Если существует , которое не является образом ни одного из элементов множества A , то преобразование f называется отображением множества A «в» B.

Если f(A) = B , то отображение называется «на», A «на» B.


Множество, задаваемое функцией , которое включает, элементы множества A называются прообразом множества B . В общем случае может обеспечить неоднозначное преобразование.

Отображение называется взаимнооднозначным, если каждому элементу множества A соответствует один элемент множества B и наоборот.

Отображение A «в» B называется гомоморфизм, если выполняется условие .

Изоморфизм – множество A «на» B является взаимнооднозначным гомоморфизмом, то есть , тогда семантическая модель представляет собой изоморфизм множества A в Ψ (пси), где A – фиксированное множество элементов исследуемой области с исследуемыми связями между ними.

Пси определяется следующим набором:

где – множество элементов модели соответствующих элементам предметной области, носитель модели, – предикаты, характеризующие отношения между элементами предметной области.

Предикат – это логическое выражение содержащие производное число аргументов и принимающее два значения, либо «истинное», либо «ложное».

Пример: хороший студент

Предикаты называются сигнатурой модели. Носитель модели является содержательной областью для предикатов. Выбор сигнатуры и носителя модели определяется рассматриваемой предметной областью.

Семантическая модель системы

Рассмотрим модель системы с точки зрения возможности реализации процедур декомпозиции, анализа и синтеза. Модель рассматривается как отображение , тогда система определяется следующим набором:

где - подмодель, характеризующая преобразование, реализуемое системой. Часто представляется при помощи «черного ящика», о котором известно, что определенный набор входных факторов приводит к определенному значению выходных факторов.

Подмодель, характеризующая структуру системы при ее внутреннем рассмотрении.

Предикат целостности, который характеризует семантику (смысл) подмоделей и , семантику преобразования и .

Если =1 – это «истина», это означает, что подмодели и семантически связаны.

Рассмотрим:

,

где - входные характеристики модели;

Набор выходов модели;

Характеризует состояние системы в определенный момент времени.

Зная элемент z в определенный момент времени, можно определить значение элементов y .

f , g – это функционалы (глобальные уравнения системы) связывающие выход модели x и z , то есть они определяют текущие значения состояния системы и ее входных характеристик.

(1.2)

, (1.3)

Уравнение (1.2) называется уравнением наблюдения, (1.3) – уравнение состояние.

Если систему удается описать при помощи формул, то она уже не рассматривается как «черный ящик». Однако часто это не удается. Помимо данных выражений система определяется тремя аксиомами:

1. Для каждой системы должно быть определено множество (пространство) Z возможных состояний, в которых может находиться система, а также параметры пространства T, в котором определено поведение системы.

2. Число элементов множества Z не должно быть меньше двух.

3. Система должна обладать свойством функциональной эмерджентности. Это свойство системы, которое принципиально не может быть выведено из свойств его отдельных элементов и подсистем данной системы.

Таким образом, система может быть представлена в виде модели, которая включает подмодели и связи между ними.

Классификация систем

Системы классифицируют:

1) По происхождению:

a) естественные;

b) искусственные.

Социально-экономическая система – это объединение людей и машин, при реализации определенных функций связанных с достижением конкретных целей.

2) По объективности существования:

a) материальные системы (существуют объективно не зависимо от нашего сознания);

b) идеальные (складывается в сознании человека).

3) По взаимодействию с внешней средой:

a) открытые;

b) закрытые.

Если каждый элемент системы имеет связи только с элементами подсистем данной системы, система называется закрытой. Если хотя бы один элемент имеет связь с внешней средой, то система является открытой. Закрытых систем на практике почти не бывает. Моделирование закрытой системы производится, когда необходимо исследовать поведение систем при обрыве внешних связей. Если при обрыве внешних связей или при резком изменении характеристик внешней среды показатели функциональной системы не выходят из допустимого интервала, то система называется слабозависящей от внешней среды.

4) По действию во времени:

a) статические системы (не зависят от времени);

b) динамические.

На практике все системы являются динамические.

5) По обусловленности действия:

a) детерминированные;

b) вероятностные.

В детерминированных системах характеристики изменяются по заранее известным законам. В вероятностных системах предсказать их поведение можно только с определенной степенью вероятности (математическая теория вероятности).

6) По степени сложности:

a) сложные;

b) особо сложные;

c) простые.

При этом учитывается иерархия системы, количество элементов и связей.

Сложная система характеризуется:

· целостностью реакции на внешнее воздействие;

· большая размерность – это большое количество входов и выходов и сложный характер преобразований входных переменных в выходные;

· сложный характер связей. Изменение любого из элементов оказывающих влияние на другие элементы.

Свойства систем

Целостность – означает наличие некоторых общих целей у элементов системы. Также с данным понятием связаны симметрия и асимметрия, которые определяют степень соразмерности в пространстве и во времени связей между элементами.

Неодетивность – это появление нового качества системы, которое вызвано эффектом объединения элементов, то есть сумма эффектов от реализации элементов отличающихся от эффекта реализации системы в целом.

Эмерджентность – это появление новых свойств системы, которые не свойственны элементам системы.

Синергизм – это получение дополнительного эффекта от согласованной и целенаправленной деятельности элементов системы. Проявлением является мультипликативный эффект, то есть суммарный эффект равен не сумме, а произведению эффектов функциональных элементов.

Обособленность – это определенная изолированность системы от внешней среды.

Согласованность – это наличие взаимосвязей элементов подсистем системы с элементами других систем. Также системы низкого уровня должны быть связаны с системами высокого уровня.

Адаптивность – это способность системы подстраиваться под изменения внутренней и внешней среды.

Система с управлением

При проектировании баз данных используются семантическое моделирование для создания концептуальной модели предметной области и отражение ее спецификаций в среде конкретной СУБД. Однако зачастую полученная концептуальная схема базы данных существенно отличается от первоначальной концептуальной модели.
В 70-е годы реляционная модель данных возникла как ответ на потребность в простой СУБД, соответствующей уровню развития компьютерной технологии своего времени. Реляционная база данных - это совокупность отношений, содержащих всю информацию, которая должна храниться в БД; пользователи могут воспринимать такую базу данных как совокупность таблиц.Сегодня гораздо важнее удобство проектирования и эксплуатации баз данных, а то, что когда-то казалось простым, математически строгим и логичным, стало восприниматься как неудобное. Семантическое расширение реляционной модели
Большая часть данных, возникающих в ходе деятельности, например, предприятия, представляется в виде электронных и бумажных документов. С точки зрения манипулирования этими данными все аспекты хозяйственной деятельности либо являются документооборотом, либо могут быть формально к нему сведены. Сегодня доминирующее положение занимают реляционные СУБД, которые обеспечивают удобный способ хранения информации в виде таблиц.Структуру данных большинства реальных документов можно представить как произвольное иерархическое дерево с горизонтальными связями. Документы полностью хранятся в одной ячейке таблицы реляционной базы либо разбиваются на множество таблиц, а некоторые таблицы из разных документов объединяются. Однако в реляционной базе данных мы уже имеем дело с другими документами, поэтому алгоритм обработки реального документа нельзя сделать основой алгоритма программного кода хранимой процедуры. Реальные документы снова появляются лишь на уровне приложения. Здесь, по сути, мы имеем дело не с отображением, а с перепроектированием документов и, соответственно, документооборота.Как известно, целью реляционного подхода было преодоление ограничений ранних систем — иерархических и сетевых. Реляционная модель достаточна для моделирования предметных областей, но само проектирование базы в терминах отношений часто оказывается очень сложным. Потребность проектировщиков в более удобных и мощных средствах представления предметной области вызвала появление семантического моделирования .Основная цель исследований в этой области состоит в том, чтобы сделать СУБД более «разумными», максимально отражающими особенности прикладной области. Если в основу СУБД будет положена модель данных, более соответствующая семантике предметной области, то и построенные на ее основе базы данных будут больше соответствовать реальным системам, а проектирование баз данных значительно упростится. Семантическое моделирование представляет собой моделирование структуры данных, опираясь на смысл этих данных. В качестве инструмента семантического моделирования используются различные варианты диаграмм сущность-связь (ER - Entity-Relationship). Первый вариант модели сущность-связь был предложен в 1976 г. Питером Пин-Шэн Ченом. В дальнейшем многими авторами были разработаны свои варианты подобных моделей (нотация Мартина, нотация IDEF1X, нотация Баркера и др.). Кроме того, различные программные средства, реализующие одну и ту же нотацию, могут отличаться своими возможностями.По сути, все варианты диаграмм сущность-связь исходят из одной идеи - рисунок всегда нагляднее текстового описания. Все такие диаграммы используют графическое изображение сущностей предметной области, их свойств (атрибутов), и взаимосвязей между сущностями.Основные понятия ER-диаграмм (близко к нотации Баркера)Определение 1. Сущность - это класс однотипных объектов, информация о которых должна быть учтена в модели.Каждая сущность должна иметь наименование, выраженное существительным в единственном числе.Примерами сущностей могут быть такие классы объектов как "Поставщик", "Сотрудник", "Накладная".Каждая сущность в модели изображается в виде прямоугольника с наименованием:Определение 2. Экземпляр сущности - это конкретный представитель данной сущности.Например, представителем сущности "Сотрудник" может быть "Сотрудник Иванов".Экземпляры сущностей должны быть различимы, т.е. сущности должны иметь некоторые свойства, уникальные для каждого экземпляра этой сущности .Определение 3. Атрибут сущности - это именованная характеристика, являющаяся некоторым свойством сущности.Наименование атрибута должно быть выражено существительным в единственном числе (возможно, с характеризующими прилагательными).Примерами атрибутов сущности "Сотрудник" могут быть такие атрибуты как "Табельный номер", "Фамилия", "Имя", "Отчество", "Должность", "Зарплата" и т.п.Атрибуты изображаются в пределах прямоугольника, определяющего сущность:Определение 4. Ключ сущности - это неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности. Неизбыточность заключается в том, что удаление любого атрибута из ключа нарушается его уникальность.Сущность может иметь несколько различных ключей.Ключевые атрибуты изображаются на диаграмме подчеркиванием:Определение 5. Связь - это некоторая ассоциация между двумя сущностями. Одна сущность может быть связана с другой сущностью или сама с собою.Связи позволяют по одной сущности находить другие сущности, связанные с нею.Например, связи между сущностями могут выражаться следующими фразами - "СОТРУДНИК может иметь несколько ДЕТЕЙ", "каждый СОТРУДНИК обязан числиться ровно в одном ОТДЕЛЕ".Графически связь изображается линией, соединяющей две сущности:Каждая связь имеет два конца и одно или два наименования. Наименование обычно выражается в неопределенной глагольной форме: "иметь", "принадлежать" и т.п. Каждое из наименований относится к своему концу связи. Иногда наименования не пишутся ввиду их очевидности.Каждая связь может иметь один из следующих типов связи:Связь типа один-к-одному означает, что один экземпляр первой сущности (левой) связан с одним экземпляром второй сущности (правой). Связь один-к-одному чаще всего свидетельствует о том, что на самом деле мы имеем всего одну сущность, неправильно разделенную на две.Связь типа один-ко-многим означает, что один экземпляр первой сущности (левой) связан с несколькими экземплярами второй сущности (правой). Это наиболее часто используемый тип связи. Левая сущность (со стороны "один") называется родительской, правая (со стороны "много") - дочерней.Связь типа много-ко-многим означает, что каждый экземпляр первой сущности может быть связан с несколькими экземплярами второй сущности, и каждый экземпляр второй сущности может быть связан с несколькими экземплярами первой сущности. Тип связи много-ко-многим является временным типом связи , допустимым на ранних этапах разработки модели. В дальнейшем этот тип связи должен быть заменен двумя связями типа один-ко-многим путем создания промежуточной сущности.Каждая связь может иметь одну из двух модальностей связи :Модальность "может" означает, что экземпляр одной сущности может быть связан с одним или несколькими экземплярами другой сущности, а может быть и не связан ни с одним экземпляром.Модальность "должен" означает, что экземпляр одной сущности обязан быть связан не менее чем с одним экземпляром другой сущности.Связь может иметь разную модальность с разных концов.Описанный графический синтаксис позволяет однозначно читать диаграммы, пользуясь следующей схемой построения фраз:Каждый экземпляр СУЩНОСТИ 1 МОДАЛЬНОСТЬ СВЯЗИ НАИМЕНОВАНИЕ СВЯЗИ ТИП СВЯЗИ экземпляр СУЩНОСТИ 2 .Каждая связь может быть прочитана как слева направо, так и справа налево. Например,
Слева направо: "каждый сотрудник может иметь несколько детей".
Справа налево: "Каждый ребенок обязан принадлежать ровно одному сотруднику".Разработкa простой ER-модели При разработке ER-моделей мы должны получить следующую информацию о предметной области:*Список сущностей предметной области.
*Список атрибутов сущностей.
*Описание взаимосвязей между сущностями.ER-диаграммы удобны тем, что процесс выделения сущностей, атрибутов и связей является итерационным. Разработав первый приближенный вариант диаграмм, мы уточняем их, опрашивая экспертов предметной области. При этом документацией, в которой фиксируются результаты бесед, являются сами ER-диаграммы.Например, проектируемая система должна выполнять следующие действия:Хранить информацию о покупателях.
Печатать накладные на отпущенные товары.
Следить за наличием товаров на складе.Выделим все существительные в этих предложениях - это будут потенциальные кандидаты на сущности и атрибуты, и проанализируем их (непонятные термины будем выделять знаком вопроса):Покупатель - явный кандидат на сущность.
Накладная - явный кандидат на сущность.
Товар - явный кандидат на сущность
(?)Склад - а вообще, сколько складов имеет фирма? Если несколько, то это будет кандидатом на новую сущность.
(?)Наличие товара - это, скорее всего, атрибут, но атрибут какой сущности?
Сразу возникает очевидная связь между сущностями - "покупатели могут покупать много товаров" и "товары могут продаваться многим покупателям". Первый вариант диаграммы выглядит так:Куда поместить сущности "Накладная" и "Склад" и с чем их связать? Спросим себя, как связаны эти сущности между собой и с сущностями "Покупатель" и "Товар"? Покупатели покупают товары, получая при этом накладные, в которые внесены данные о количестве и цене купленного товара. Каждый покупатель может получить несколько накладных. Каждая накладная обязана выписываться на одного покупателя. Каждая накладная обязана содержать несколько товаров (не бывает пустых накладных). Каждый товар, в свою очередь, может быть продан нескольким покупателям через несколько накладных. Кроме того, каждая накладная должна быть выписана с определенного склада, и с любого склада может быть выписано много накладных. Таким образом, после уточнения, диаграмма будет выглядеть следующим образом:Пора подумать об атрибутах сущностей:Каждый покупатель является юридическим лицом и имеет наименование, адрес, банковские реквизиты.
Каждый товар имеет наименование, цену, а также характеризуется единицами измерения.
Каждая накладная имеет уникальный номер, дату выписки, список товаров с количествами и ценами, а также общую сумму накладной. Накладная выписывается с определенного склада и на определенного покупателя.
Каждый склад имеет свое наименование.Снова выпишем все существительные, которые будут потенциальными атрибутами, и проанализируем их:Юридическое лицо - термин риторический, мы не работаем с физическими лицами. Не обращаем внимания.
Наименование покупателя - явная характеристика покупателя.
Адрес - явная характеристика покупателя.
Банковские реквизиты - явная характеристика покупателя.
Наименование товара - явная характеристика товара.
(?)Цена товара - похоже, что это характеристика товара. Отличается ли эта характеристика от цены в накладной?
Единица измерения - явная характеристика товара.
Номер накладной - явная уникальная характеристика накладной.
Дата накладной - явная характеристика накладной.
(?)Список товаров в накладной - список не может быть атрибутом. Вероятно, нужно выделить этот список в отдельную сущность.
(?)Количество товара в накладной - это явная характеристика, но характеристика чего? Это характеристика не просто "товара", а "товара в накладной".
(?)Цена товара в накладной - опять же это должна быть не просто характеристика товара, а характеристика товара в накладной. Но цена товара уже встречалась выше - это одно и то же?
Сумма накладной - явная характеристика накладной. Эта характеристика не является независимой. Сумма накладной равна сумме стоимостей всех товаров, входящих в накладную.
Наименование склада - явная характеристика склада.С возникающим понятием "Список товаров в накладной" все довольно ясно. Сущности "Накладная" и "Товар" связаны друг с другом отношением типа много-ко-многим. Такая связь, как мы отмечали ранее, должна быть расщеплена на две связи типа один-ко-многим. Для этого требуется дополнительная сущность. Этой сущностью и будет сущность "Список товаров в накладной". Связь ее с сущностями "Накладная" и "Товар" характеризуется следующими фразами - "каждая накладная обязана иметь несколько записей из списка товаров в накладной", "каждая запись из списка товаров в накладной обязана включаться ровно в одну накладную", "каждый товар может включаться в несколько записей из списка товаров в накладной", " каждая запись из списка товаров в накладной обязана быть связана ровно с одним товаром". Атрибуты "Количество товара в накладной" и "Цена товара в накладной" являются атрибутами сущности " Список товаров в накладной".Точно также поступим со связью, соединяющей сущности "Склад" и "Товар". Введем дополнительную сущность "Товар на складе". Атрибутом этой сущности будет "Количество товара на складе". Таким образом, товар будет числиться на любом складе и количество его на каждом складе будет свое.Теперь можно внести все это в диаграмму:Концептуальные и физические ER-модели Разработанный выше пример ER-диаграммы является примером концептуальной диаграммы. Это означает, что диаграмма не учитывает особенности конкретной СУБД. По данной концептуальной диаграмме можно построить физическую диаграмму, которая уже будут учитываться такие особенности СУБД, как допустимые типы и наименования полей и таблиц, ограничения целостности и т.п. Приведенный физический вариант диаграммы может выглядеть, например, следующим образом:На данной диаграмме каждая сущность представляет собой таблицу базы данных, каждый атрибут становится колонкой соответствующей таблицы. Обращаем внимание на то, что во многих таблицах, например, "CUST_DETAIL" и "PROD_IN_SKLAD", соответствующих сущностям "Запись списка накладной" и "Товар на складе", появились новые атрибуты, которых не было в концептуальной модели - это ключевые атрибуты родительских таблиц, мигрировавших в дочерние таблицы для того, чтобы обеспечить связь между таблицами посредством внешних ключей.Таким образом, реальным средством моделирования данных является не формальный метод нормализации отношений, а так называемое семантическое моделирование.В качестве инструмента семантического моделирования используются различные варианты диаграмм сущность-связь (ER - Entity-Relationship).Диаграммы сущность-связь позволяют использовать наглядные графические обозначения для моделирования сущностей и их взаимосвязей.Сущности, определенные в концептуальной диаграмме становятся таблицами, атрибуты становятся колонками таблиц (при этом учитываются допустимые для данной СУБД типы данных и наименования столбцов), связи реализуются путем миграции ключевых атрибутов родительских сущностей и создания внешних ключей .Основное достоинство метода состоит в том, модель строится методом последовательных уточнений первоначальных диаграмм.Не рассматривались более сложные аспекты построения диаграмм, такие как подтипы, роли, исключающие связи, непереносимые связи, идентифицирующие связи и т.п.

Нормализация

Основная статья: Нормальная форма

При проектировании реляционных баз данных обычно выполняется так называемая нормализация.

Модели ʼʼсущность-связьʼʼ

Основная статья: ER-модель данных

Модель ʼʼсущность-связьʼʼ (англ. “Entity-Relationship model” ), или ER-модель, предложенная П. Ченом в 1976 ᴦ., является наиболее известным представителœем класса семантических (концептуальных, инфологических) моделœей предметной области. ER-модель обычно представляется в графической форме, с использованием оригинальной нотации П. Чена, называемой ER-диаграмма , либо с использованием других графических нотаций (Crow"s Foot , Information Engineering и др.).

Основные преимущества ER-моделœей:

· наглядность;

· модели позволяют проектировать базы данных с большим количеством объектов и атрибутов;

· ER-модели реализованы во многих системах автоматизированного проектирования баз данных (к примеру, ERWin).

Основные элементы ER-моделœей:

· объекты (сущности);

· атрибуты объектов;

· связи между объектами.

Сущность - объект предметной области, имеющий атрибуты.

Связь между сущностями характеризуется:

· типом связи (1:1, 1:N, N:М);

· классом принадлежности. Класс должна быть обязательным и необязательным. В случае если каждый экземпляр сущности участвует в связи, то класс принадлежности - обязательный, иначе - необязательный.

Семантическая модель (концептуальная модель, инфологическая модель) – модель предметной области, предназначенная для представления семантики предметной области на самом высоком уровне абстракции. Это означает, что устранена или минимизирована крайне важно сть использовать понятия ʼʼнизкого уровняʼʼ, связанные со спецификой физического представления и хранения данных.

Семантическое моделирование стало предметом интенсивных исследований с конца 1970-х годов. Основным побудительным мотивом подобных исследований (ᴛ.ᴇ. проблемой, которую пытались разрешить исследователи) был следующий факт. Дело в том, что системы баз данных обычно обладают весьма ограниченными сведениями о смысле хранящихся в них данных. Чаще всœего они позволяют лишь манипулировать данными определœенных простых типов и определяют некоторые простейшие ограничения целостности, наложенные на эти данные. Любая более сложная интерпретация возлагается на пользователя. При этом было бы замечательно, в случае если бы системы могли обладать немного более широким объёмом сведений и несколько интеллектуальнее отвечать на запросы пользователя, а также поддерживать более сложные (ᴛ.ᴇ. более высокоуровневые) интерфейсы пользователя. […] Идеи семантического моделирования бывают полезны как средство проектирования базы данных даже при отсутствии их непосредственной поддержки в СУБД.

Наиболее известным представителœем класса семантических моделœей является модель ʼʼсущность-связьʼʼ (ER-модель).

Семантические модели - понятие и виды. Классификация и особенности категории "Семантические модели" 2017, 2018.

  • - Семантические модели данных

    ER-диаграммы Вопрос 35 Широкое распространение реляционных СУБД и их использование в самых разнообразных приложениях показывает, что реляционная модель данных достаточна для моделирования предметных областей. Однако проектирование реляционной базы данных... .

    Реляционные, сетевые и иерархические модели данных отображают фактографическую информацию и относятся к синтаксическим моделям. Для отображения дополнительной информации к фактографической (например: событийность, время, место и т.д.) используют семантические модели... .


  • § 500. Проблема определения структурно-семантических моделей.

    Эта проблема связана с определением типовых ситуаций (процессов, отношений), которые могут описываться предложениями. Несмотря на бесконечное разнообразие конкретных ситуаций, их можно свести в определенные классы. Ситуация, которая является обозначаемым предложения, определяется характером процесса (события) и ролями участников этого процесса. Поэтому в лингвистике наметилось два пути определения типов ситуаций: актантно-ролевой и предикатно-глагольный. В первом случае обращается внимание на функцию (роль) участников процесса (актантов), во втором – на характер самого процесса. В этом случае типы ситуаций соотносительны с семантическими типами предикатов и глаголов. Поскольку тип процесса и роль актантов явления взаимозависимые, наиболее эффективное решение проблемы – одновременный учет типа процесса и функций актантов.

    Начало разработки актантно-ролевого представления ситуации связано с именем Л. Теньера . Как отмечалось в § 368 , Теньер различал три вида актантов: первый, второй и третий (prime, second, tiers actant), которым он дал, однако, противоречивую трактовку. С одной стороны, он их рассматривал как семантические сущности (1-й актант совершает действие, 2-й претеPIIевает его, 3-й – актант, в чью пользу или в ущерб которому осуществляется действие): Alfred (1) donne le livre (2) à Charles (3). С другой, он при их выделении исходил из синтаксических форм, так что 1-й актант отождествляется с подлежащим, 2-й с прямым дополнением, 3-й – с косвенным. Во фазе Alfred a été frappé par Charles слово Charles рассматривается как «второй актант пассива», поскольку оно вводится предлогом, хотя указывает на реального деятеля.

    Греймас сделал важный щаг в развитии семантического синтаксиса. Он провел различие между семантическими актантами, которые выделяются в описываемой ситуации, и синтаксическими (см. пример с Адамом, Евой и яблоком в § 368 ). Он расширил число актантов, представив их в виде оппозиции трех пар: субъект/объект, отправитель/адресат, помощник/противодействователь. Заслугой Греймаса является также попытка связать семантические актанты с фактами литературы. Дело в том, что именно литература (от фольклора и анекдотов до больших романов) описывает все те ситуации, в которых может оказаться человек и окружающий его мир. Структурный анализ русских сказок советского исследователя В. Проппа и драматических произведений французского литературоведа Сурьо показал, что в произведениях различного содержания выделяются постоянные типичные функции: герой (субъект), объект, помощник, противодействователь и т. п. Это подтвердило, что в семантических актантах, выделяемых лингвистами, отражаются категории реальных явлений объективного мира.



    В дальнейшем исследования пошли по пути уточнения номенклатуры актантов и стремления связать их с типом самого процесса. Если актанты определять как любые субстанции, затрагиваемые процессом, то в их число следует включить не только субъект, объект, адресат, но и орудие, и субстанцию, связанную с другой отношениями принадлежности. К актантам следует также отнести временной и локальный конкретизаторы, поскольку они обозначаются прежде всего существительными (à la maison, l"année passée); их наречные обозначения (ici, alors) представляют дейктические замены. Этим актантам соответствуют семь субстантивных ЧПр в структуре предложения: подлежащее, прямое и косвенное дополнение, дополнение орудия, дополнение к имени, обстоятельства места и времени.

    Несколько позже стала развиваться грамматика «падежей», в которой термин «актант» уступил место термину «падеж», обозначающему приглагольный член в определенной роли. В этой грамматике функциональные роли (падежи) стали увязываться с характером самого процесса. Филлмор выделил шесть падежей: агентивный (одушевленный инициатор процесса), орудийный, объектный, локативный, дативный, контрагентивный (агенс при пассивном глаголе). Во фразе Pierre ouvre la porte подлежащее выражает агентивный «падеж», в La clé ouvre la porte – орудийный.

    Чейф более тесно связал тип падежа с типом процесса, выделив шесть типов процесса: состояние, собственно процесс, действие, процесс-действие, состояние и изменение окружающей среды, и семь падежей: агент (Pierre a cassé une assiette), патиент (Pierre dort), экспериенцер (Pierre veut boire), бенефициант (Pierre a une voiture), инструмент, местоположение, дополнение (Marie chante une chanson). Мы видим разграничение субъекта на ряд сущностей в зависимости от типа процесса (агент при активном действии, патиент при состоянии, экспериенцер при отношении, испытании чего-л.).



    Потье различает два типа процессов, которые он называет voix: атрибутивный (сообщение о признаках предмета): Le chat dort, le chat est noir, le chat est un animal и активный (сообщение о воздействии одного предмета на другой): Marie coupe la tarte. Центром высказывания является глагол, вокруг которого организуются три зоны актантов (падежей):

    Зона I включает основные падежи(то есть функции): номинатив (субъект атрибутивного отношения): La lune est ronde, эргатив (субъект активного действия): La lune éclaire la campagne, аккузатив (дополнение). Зона II a охватывает падежи, обозначающие источник события: каузатив (причина), инструменталь (орудие), агентив (дополнение пассивного глагола); зона III–падежи, обозначающие элементы, следующие за основным отношением: датив (à Jean), бенефактив (pour Jean), финаль (цель). Зона III объединяет сирконстанты – пространственные, временные и качественные характеристики.

    Положительной стороной рассматриваемых теорий является стремление разграничить синтаксическую и семантическую структуру предложения, что необходимо ввиду асимметрии формы и содержания в синтаксисе (§ 360 ). Тот факт, что количество и номенклатура функций (актантов, падежей) не совпадают, свидетельствует об объективной сложности: в реальном мире, как и в языке, нет четких разграничительных линий.

    Рижель и другие , различая синтаксические отношения и «глубинные падежи» («семантические роли»), определяют для французского языка 9 «ролей», оговариваясь, однако, что в зависимости от разных факторов и подходов номенклатура их может оказаться различной. Эти падежи следующие: 1) агенс (agent, acteur)– инициатор и «контролер» процесса: L"enfant caresse le chien; 2) объект (пациенс, patient) – субстанция, на которую непосредственно воздействует процесс: Le chien a mordu l"enfant; 3) бенефициент (датив, bénéficiaire) – одушевленное существо, затрагиваемое процессом: Le tribunal a retire son permis de conduire au chauffard; //// a reçu la Légion d"honneur; 4) средоточие (siège) физического или психического состояния: Les vitres tremblent; Jean est content; 5) орудие (instrument) – Pierre ouvre la porte avec cette clef; // Cette clef ouvre la porte; 6) локатив – пространственный конкретизатор: Les clef sont dans le tiroir; // Le tiroir contenait des clés; 7) цель (but) – сущность,к которой направлено действие: Pierre lance la balle à Jean; // Le tireur a raté le cible; 8) результат (résultatif) – следствие процесса: Jean a écrit plusieurs romans; 9) источник (source), от которого происходит или отдаляется другая сущность: Vénus son de l"onde; // Il s"est séparé de sa femme.

    Выделение типов предикатов.

    Классификация предикатов (типов процессов) также исключительно сложна, ибо одни типы постепенно переходят в другие. О сложности решения этого вопроса свидетельствует опыт Потье, который вначале выделил пять фундаментальных семантических типов предложения, затем расширил их до 10, потом свел к 6, выделив «залоги»: экзистенциальный: Il y a А; отождествляющий: A est président; ситуативный: A se trouve à В; дескриптивный: A est bien, A rit; посессивный: А а В; субъективный: A voit В. У некоторых типов имеются подтипы, все они имеют три «статуса» – статический: А se trouve à В, динамический: A entre à В, каузативный: С fait entrer A à В, что дает от 18 до 32 базовых типов предложений; но и в этой схеме есть уязвимые места .

    Уже в этом перечне мы находим попытку выделения типов ситуаций (предикатов) на основании перекрещивающихся признаков. В самом общем виде можно различать, с одной стороны, процессы, заключенные в самом субъекте, и процессы, охватывающие субъект и объект, и с другой – процессы статичные и динамичные. Пересечение этих двух признаков дает четыре фундаментальных типа процесса, которые символизируются общими глаголами:

    безобъектный: статический (être) – динамический (aller),

    объектный: статический (avoir) – динамический (faire).

    Т. В. Булыгина проводит подробный компонентный анализ предикатов (а следовательно, и типов ситуаций), включающий противопоставления: вневременность/эпизодичность; динамичность/нединамичность; длительность/недлительность; перспективность/неперспективность; постепенность/непостепенность; контролируемость/неконтролируемость и др. . Сочетания этих признаков позволяют объективно различить явления, процессы, события, происшествия и т. п. Опыты классификации предикатов (и вместе с тем семантических типов предложений) были предприняты российскими лингвистами на материале разных языков [см. 3, 25 (2), 35, 41, 48 (2)]. Во многом эти классификации (при различии терминологий) совпадают – везде выделяются отмеченные выше четыре основных класса. Но имеются и различия, объясняемые частично спецификой языков. Так, в русском языке как отдельный тип выделяется квантификация субъекта (Волков много или; Их было пять). Во французском этот семантический тип не имеет специфической формы и может рассматриваться как смысловой вариант квалификативного предиката (Ils étaient cinq). При описании конкретного языка важно, выделяя ситуации, учитывать языковые формы.

    В объективной действительности можно выделитьпрежде всего следующие фундаментальные типы ситуаций:

    1. Ситуация бытия: Les Martiens existent-ils?Отображается бытийным предикатом: exister, être, il y a.

    2. Определение предмета, его признаков, качеств: Pierre est étudiant; репрезентируется именным сказуемым.

    3. Бессубъектный процесс: Il pleut; оформляется с помощью безличного предложения.

    4. Субъектно-безобъектный процесс, сосредоточенный в самом субъекте: Pierre dort. Выражается непереходным глаголом.

    5. Субъектно-объектный процесс, проявление субъекта по отношению к другому предмету. Здесьразличаются: а) локализация субъекта: Pierre va à Paris; б) отношение субъекта к объекту: Pierre aime Marie; в) действие субъекта по отношению к объекту: Pierre lit un livre. Эти ситуации описываются с помощью Vt или Vi с обязательным дополнением или обстоятельством.

    Многие модели могут иметь варианты – статический и динамический, а внутри последнего инхоативный (начало, становление явления) и финитный (прекращение действия), а также каузативный. Мы рассмотрим соотношение между структурно-семантическими моделями (поверхностный уровень) и семантическими типами предложений (глубинный уровень) в семасиологическом и ономасиологическом аспектах(от форм к содержанию и от содержания к формам).