Главная страница «Первого сентября»Главная страница журнала «Информатика»Содержание №17/2009


Теоретические основы информатики

Искусственный интеллект: популярное введение для учителей и школьников

“Можно сказать, что человек, освоивший методы искусственного интеллекта, поднимается на качественно новый уровень своего развития.

Можно сказать, что у него появляется дар предвидения.

Он может предсказывать будущие события.

И он знает, как повлиять на эти события.

Он знает, что нужно сделать, чтобы события развивались в нужном направлении.

Раньше таких людей называли волшебниками и колдунами.

Поэтому можно почти без преувеличения сказать, что изучаемый вами элективный курс учит вас искусству колдовства.

Изучив этот предмет, вы можете свободно пользоваться основными нейросетевыми технологиями и даже применять их для достижения своих личных целей. Как и каким образом? Это зависит от вашей собственной фантазии и от того, насколько глубоко вы поняли идеи и освоили методы искусственного интеллекта”.

Этими словами заканчивается новый учебно-методический комплекс “Искусственный интеллект”, готовящийся к выпуску издательством “БИНОМ” к осени 2009 года. Сегодня мы продолжаем сокращенную публикацию материалов элективного курса и планируем в дальнейшем охватить его целиком с тем расчетом, чтобы читатели нашей газеты сами смогли овладеть обещанным выше искусством колдовства.

Понятие об экспертных системах

Данные и знания

Как правило, любая, даже самая простая, компьютерная программа оперирует не только с данными, но и со знаниями. Например, фрагмент программы, предназначенной для вычисления площади треугольника с основанием a см и высотой h см, на языке Pasсal может выглядеть следующим образом:

a := 20;

h := 15;

s := 0.5*a*h;

writeln('Площадь треугольника S=', s, 'кв.см');

Первые два оператора представляют собой данные, а третий оператор — знание. Это всем известная формула для вычисления площади треугольника. Она является результатом интеллектуальной деятельности древних геометров.

Прежде чем сформулировать определение знаний, вспомним, что собой представляют данные.

Данные — это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

При обработке данные последовательно трансформируются:

· данные, существующие как результат измерений и наблюдений;

· данные на материальных носителях информации — в таблицах, протоколах, справочниках;

· данные, представленные в виде диаграмм, графиков, функций;

· данные в компьютере на языке описания данных;

· базы данных.

Знания основываются на данных, но представляют собой результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе практической деятельности или научных исследований. Они могут выражать законы природы и общества, закономерности конкретных предметных областей.

При обработке на ЭВМ знания трансформируются аналогично данным:

· знания, существующие в памяти человека как результат обучения, воспитания, мышления;

· знания, помещенные на материальных носителях: в учебниках, инструкциях, методических пособиях, книгах;

· S знания, описанные на языках представления знаний и помещенные в компьютер;

· базы знаний.

Итак, для хранения данных в компьютере используются базы данных, а для хранения знаний используются базы знаний.

В приведенном выше фрагменте программы вычисления площади треугольника знания растворены в самом тексте программы. Такой вид представления знаний называют процедурным. Корректировка таких знаний требует изменения самого текста программы. Поэтому с развитием искусственного интеллекта все большая часть знаний стала сосредотачиваться в отдельных структурах. Такие знания называются декларативными.

Существует множество способов представления декларативных знаний. Мы рассмотрим только три наиболее употребляемых способа:

· продукционные правила;

· фреймы;

· семантические сети.

Способы представления знаний

Продукционные правила

Продукционные правила имеют следующий вид:

ЕСЛИ “условие”, ТОдействие”.

Например:

ЕСЛИ “холодно”, ТО “надеть шубу”;

ЕСЛИ “идет дождь”, ТО “взять зонтик”.

Продукционные правила — это наиболее часто используемый способ представления знаний в современных экспертных системах. Основными преимуществами таких экспертных систем являются: высокая модульность, легкость внесения изменений и дополнений, простота механизма логического вывода.

Фреймы

В психологии и философии используется понятие абстрактного образа. Например, слово “автомобиль” вызывает у слушающих образ устройства, способного перемещаться, имеющего четыре колеса, салон для шофера и пассажиров, двигатель, руль. Считается, что современный человек широко использует абстрактные образы для хранения в своей памяти информации об окружающем мире.

Фрейм — это модель абстрактного образа, которую программисты используют для хранения знаний о рассматриваемой предметной области. Фрейм состоит из имени и отдельных единиц, называемых слотами. Обычно он имеет следующую структуру:

Имя фрейма

Имя 1-го слота: значение 1-го слота.

Имя 2-го слота: значение 2-го слота.

. . . . . . . . . . . . . . . . . . . . .

Имя N-го слота: значение N-го слота.

В качестве значения слота может выступать имя другого фрейма. Таким образом фреймы объединяются в сеть. Свойства фреймов наследуются сверху вниз, т.е. от вышестоящих к нижестоящим через АКО-связи (начальные буквы английских слов “a kind of”, что можно перевести как “это”). Слот с именем АКО указывает на имя фрейма более высокого уровня иерархии.

Например, на рис. 1 фрейм “Студент” имеет ссылки на вышестоящие фреймы: “Человек” и “Млекопитающее”. Поэтому на вопрос “Может ли студент мыслить?” ответ будет положительным, так как этим свойством обладает вышестоящий фрейм “Человек”.

Если одно и то же свойство указывается в нескольких связанных между собой фреймах, то приоритет отдается нижестоящему фрейму. Так, возраст фрейма “Студент” не наследуется из вышестоящих фреймов.

Основным преимуществом фреймов как способа представления знаний является наглядность и гибкость в употреблении. Кроме того, по мнению многих психологов, фреймовая структура согласуется с современными представлениями о хранении информации в памяти человека.

Семантические сети

В основе этого способа представления знаний лежит идея о том, что любые знания можно представить в виде совокупности понятий (объектов) и отношений (связей). На рис. 2 приведен пример графического изображения сети, вершины которой представляют собой понятия предметной области, а связывающие их линии — отношения между этими понятиями. Сам термин семантическая означает “смысловая”.

Рис. 2. Семантическая сеть

Основным преимуществом этой модели является наглядность. Недостаток — сложность поиска вывода, а также сложность корректировки, т.е. удаления и дополнения сети новыми знаниями.

Экспертные системы

Назначение

Экспертная система — это программа, предназначенная для моделирования деятельности эксперта (специалиста) в какой-либо предметной области.

Знания, которыми обладают эксперты, можно разделить на формализуемые, плохо формализуемые и неформализуемые. Формализуемые знания излагаются в книгах и руководствах в виде законов, формул, моделей, алгоритмов. Формализуемые знания характерны для точных наук, таких, как математика, физика, химия, астрономия.

Науки, которые принято называть описательными, обычно оперируют с плохо формализуемыми знаниями. К таким наукам можно отнести, например, зоологию, ботанику, экологию, социологию, педагогику, медицину и др.

Существуют знания, которые не попадают в книги в связи с их неконкретностью, субъективностью, приблизительностью. Знания этого рода являются результатом многолетних наблюдений, опыта работы, интуиции. Они обычно представляют собой некие эмпирические и эвристические приемы и правила. Обычно они передаются из поколения в поколение в виде определенных навыков, ноу-хау, секретов ремесла.

Есть также знания, которые вообще не поддаются формализации. Они не могут быть выражены ни в математическом виде, ни в терминах обычного человеческого языка. Такими знаниями обладают религиозные деятели, экстрасенсы, контактеры, шаманы.

Класс задач, относящихся к плохо формализуемым знаниям, значительно шире класса задач, для которых знания легко поддаются формализации. Экспертные системы предназначены для работы именно с плохо формализуемыми знаниями. Этим объясняется особая популярность экспертных систем, которые сделали возможным применение компьютерных технологий в широком классе предметных областей, характеризующихся плохо формализуемыми знаниями.

Блок-схема

Типичная блок-схема экспертной системы представлена на рис. 3.

Рис. 3. Типичная блок-схема экспертной системы

Обычно в ее состав входят следующие взаимосвязанные функциональные блоки:

База знаний — ядро экспертной системы, представляет собой совокупность знаний предметной области, записанных с помощью какого-либо способа представления знаний, например, с помощью продукционных правил, фреймов, семантических сетей.

Интерфейс разработчика — программа, предоставляющая инженеру-когнитологу и программисту возможность создавать базу знаний в диалоговом режиме; включает системы вложенных меню, шаблонов языка представления знаний, подсказок (help-режим) и других сервисных средств, облегчающих работу с базой знаний.

Интерфейс пользователя — комплекс программ, реализующих диалог пользователя с экспертной системой на стадии как ввода информации, так и получения результатов.

Решатель (синонимы: дедуктивная машина, блок логического вывода) — программа, осуществляющая логический вывод путем моделирования хода рассуждений эксперта на основании знаний, имеющихся в базе знаний.

Подсистема объяснений — программа, позволяющая пользователю получать ответы на вопрос “На основании чего сделано то или иное заключение?”. Принцип работы этой программы заключается в том, что она последовательно выводит на экран компьютера все правила, которые были задействованы при получении заключения. В результате, при прочтении этих правил пользователю становится понятной логика проделанного экспертной системой вывода.

В коллектив разработчиков экспертной системы входят, как минимум, четыре специалиста (или четыре группы специалистов): эксперт, инженер-когнитолог, программист, пользователь. Возглавляет коллектив инженер-когнитолог — ключевая фигура при разработке экспертных систем. Обычно это руководитель проекта, в задачу которого входит организация всего процесса создания экспертной системы. С одной стороны, он должен быть специалистом в области искусственного интеллекта, а с другой — должен разбираться в предметной области, общаться с экспертом, извлекая и формализуя его знания, передавать их программисту, кодирующему и помещающему их в базу знаний экспертной системы.

Экспертная система работает в двух режимах — приобретения знаний и решения задач или проведения консультаций. В режиме приобретения знаний происходит формирование базы знаний. В режиме решения задач общение с экспертной системой осуществляет конечный пользователь.

Обычно знания, которыми располагает эксперт, различаются степенью достоверности, надежности, важности, четкости. В этом случае они снабжаются некоторыми весовыми коэффициентами, которые называют коэффициентами доверия (уверенности). Коэффициенты доверия могут указываться в баллах или в процентах. Например, если у больного высокая температура и он кашляет, то с уверенностью 90% можно утверждать, что он простужен, и с уверенностью 30% подозревать, что у него воспаление легких. Коэффициенты доверия обрабатываются вместе с правилами решателем экспертной системы, в результате вывод, который делает экспертная система, тоже снабжается некоторым коэффициентом доверия, который показывает, насколько такому выводу можно доверять. Процесс обработки коэффициентов доверия решателем осуществляется с помощью алгоритмов нечеткой логики, которую мы в нашем курсе касаться не будем.

В процессе опытной эксплуатации коэффициенты доверия могут подвергаться корректировке. В этом случае говорят, что происходит обучение экспертной системы. Процесс обучения экспертной системы может производиться автоматически с помощью обучающего алгоритма либо путем вмешательства инженера-когнитолога, выполняющего роль учителя.

В табл. 1 приведено несколько отличительных признаков экспертных систем от обычных компьютерных программ.

Таблица 1

Отличия экспертных систем
от обычных компьютерных программ

Характеристика

Экспертные
системы

Традиционные

компьютерные программы

Тип обработки

Символьная

Числовая

Метод

Эвристический поиск

Алгоритм

Задание шагов решения

Неявное

Точное

Искомое решение

Удовлетворительное

Оптимальное

Управление и данные

Перемешаны

Разделены

Знания

Неточные

Точные

Модификации

Частые

Редкие

Коротко о главном

Экспертная система — это сложный программный комплекс, предназначенный для моделирования деятельности специалиста (эксперта) в какой-либо предметной области. Ее главное отличие от обычных программ состоит в том, что в нее заложены знания эксперта, с помощью которых она может делать логически обоснованные выводы.

Вопросы и задания

Не на все из приведенных ниже вопросов имеются ответы в тексте статьи. Однако указанные ответы легко найти, например, в Интернете. Главное — вы знаете, что искать!

1. Дайте определение данных и знаний.

2. Как трансформируются данные и знания в процессе их обработки?

3. Какие знания называются процедурными, а какие — декларативными?

4. Перечислите основные преимущества и недостатки известных вам способов представления знаний.

5. Какой способ представления знаний наиболее распространен в современных экспертных системах?

6. Какой из рассмотренных способов представления знаний наиболее близок к способу, которым пользуется мозг человека?

7. Приведите примеры научных областей, в которых знания хорошо формализованы и где они плохо поддаются формализации.

8. Дайте определение экспертной системы.

9. Перечислите функциональные блоки, из которых состоит типичная экспертная система, укажите их назначение.

10. Что такое коэффициенты доверия и для чего они вводятся?

11. Что понимается под обучением экспертной системы?

12. Укажите несколько отличительных признаков между экспертной системой и традиционной компьютерной программой.

13. Из каких специалистов, по вашему мнению, должен состоять коллектив разработчиков экспертной системы?

14. Кто был создателем первой экспертной системы? Для чего она была предназначена?

НЕЙРОННЫЕ СЕТИ

Персептрон и его развитие

Мозг и компьютер

На самой заре компьютерной эры, в середине ХХ в., были предложены различные варианты принципов действия и архитектурного исполнения электронно-вычислительных машин. Многие из этих вариантов впоследствии были отвергнуты и забыты. Наиболее удачной оказалась архитектура машины фон Неймана, которую имеет большинство современных компьютеров. Однако наряду с машиной фон Неймана до наших дней дошла еще одна схема, которая в последние годы стремительно развивается и находит применение. Речь идет о нейро­компьютерах и нейронных сетях.

Нейронные сети и нейрокомпьютеры — это одно из направлений компьютерной индустрии, в основе которого лежит идея создания искусственных интеллектуальных устройств по образу и подобию человеческого мозга. Дело в том, что компьютеры, выполненные по схеме машины фон Неймана, по своей структуре и свойствам весьма далеки от нашего естественного компьютера — человеческого мозга. В подтверждение этому в табл. 2 приведены признаки, отличающие человеческий мозг от неймановского компьютера.

Основатели же нейрокибернетики задались целью создания электронных устройств, адекватных мозгу не только на функциональном, но и на структурном уровне. Для этого им пришлось обратиться за сведениями к биологам. Как же устроен человеческий мозг?

Известно, что мозг человека состоит из белого и серого вещества: белое вещество — это тела нервных клеток, называемых нейронами, а серое вещество — соединяющие их нервные волокна. Каждый нейрон состоит из трех частей: тела клетки, дендритов и аксона (рис. 4). Дендриты и аксон — это нервные отростки, через которые нейрон обменивается электрическими сигналами с другими нейронами. Каждый нейрон может иметь до 10 000 дендритов и всего лишь один аксон. Через дендриты нейрон принимает электрические сигналы, поступающие от других нейронов по нервным волокнам, как по проводам. Если сигналов много и они достаточно интенсивны, то нейрон переходит в возбужденное состояние и сам вырабатывает электрический сигнал, который передает в аксон. Аксон на своем другом конце разветвляется на тысячи нервных волокон, которые затем соединяются с дендритами других нейронов. Места соединения нервных волокон с дендритами называются синапсами.

Как же человеческий мозг запоминает информацию и как ее обрабатывает? Ответить на этот вопрос биологи не могли. Но зато они знали, что общее число нейронов в течение жизни человека практически не изменяется, т.е. мозг ребенка и мозг взрослого человека содержат приблизительно одинаковое количество нейронов. Примерно одинаковое количество нейронов содержит мозг ученого, политического деятеля и спортсмена. Отличие состоит в величинах электропроводностей синапсов.

Как известно из электротехники, электропроводность проводника r — это величина, обратная его электросопротивлению R и имеющая размерность
1/Ом. Биологи же электропроводности синапсов назвали силами межнейронных синаптических связей, и, по их мнению, мозг одного человека отличается от мозга другого человека прежде всего силами межнейронных синаптических связей. На этом основании была высказана гипотеза о том, что все наши мысли, эмоции, знания, вся информация, хранящаяся в человеческом мозге, закодирована в виде огромного количества цифр, характеризующих силы межнейронных синаптических связей.

Рис. 4. Нейроны человеческого мозга

А теперь давайте попробуем оценить, сколько же чисел способен запомнить такой гипотетический мозг, если принять, что с помощью одной синаптической связи можно закодировать одно число.

В человеческом мозге содержится приблизительно 1011 нейронов. Каждый нейрон связан с 103…104 другими нейронами. Таким образом, биологическая нейронная сеть, составляющая мозг человека, содержит
1014…1015 синапсов. Получается, что именно такое количество цифр способен хранить человеческий мозг. Получается, что именно таким количеством цифр закодированы в нашем мозге все наши знания, весь жизненный опыт, все мысли и эмоции, вся информация, которую мы получаем на протяжении жизни.

Таблица 2

Приведенные выше представления о строении и функционировании мозга в настоящее время считаются научно обоснованным фактом. Ни у кого из ученых не вызывает сомнений, что разум человека создается огромным количеством мельчайших нервных клеток — нейронами, непрерывно исполняющими свой информационный танец. Что это за “танец”, мы рассмотрим в следующих разделах.

Биологический и математический нейроны

Первой работой, заложившей теоретический фундамент для создания интеллектуальных устройств, моделирующих человеческий мозг на самом низшем — структурном уровне, принято считать опубликованную в 1943 г. статью Уоррена Мак-Каллока и Вальтера Питтса “Идеи логических вычислений в нервной деятельности”. Ее авторы, американские ученые математики-нейрофизиологи, по праву считающиеся основателями нейроинформатики, предложили математическую модель нейрона мозга человека, назвав ее математическим, или модельным, нейроном.

Математический нейрон Мак-Каллока – Питтса изображен на рис. 5 в виде кружочка. Он имеет несколько входов и один выход, показанные на рисунке стрелками. Через входы, число которых обозначим j, математический нейрон принимает входные сигналы xj, которые суммирует, умножая каждый входной сигнал на некоторый весовой коэффициент wj:

.                                                       (1)

После выполнения операции суммирования математический нейрон формирует выходной сигнал y согласно следующему правилу:

                                                   (2)

где — порог чувствительности нейрона.

Рис. 5. Математический нейрон Мак-Каллока - Питтса

Таким образом, математический нейрон, как и его биологический прототип — мозг, может существовать в двух состояниях — возбужденном и невозбужденном. Если взвешенная сумма входных сигналов S меньше некоторой пороговой величины , то математический нейрон не возбужден и его выходной сигнал равен нулю. Если же входные сигналы достаточно интенсивны и их сумма достигает порога чувствительности, то нейрон переходит в возбужденное состояние и на его выходе формируется сигнал y = 1.

Весовые коэффициенты wj: имеют вполне определенный физический смысл. Они имитируют электропроводности нервных волокон, тех самых, которые биологи назвали силами межнейронных синаптических связей, или синаптическими весами. Чем эти силы выше, тем больше вероятность перехода нейрона в возбужденное состояние.

Ранее мы уже отмечали, что биологи придают силам синаптических связей очень важное значение. Считается, что именно с их помощью человеческий мозг кодирует всю имеющуюся у него информацию. Как мы увидим далее, в искусственном мозге — в нейронных сетях и в нейрокомпьютерах, происходит то же самое. Вся информация в них тоже кодируется в виде множества цифр, характеризующих силы межнейронных синаптических связей wj.

Логическая функция (2) называется активационной функцией нейрона. Ее графическое изображение, представленное на рис. 6a, по форме напоминает ступеньку, поэтому ее называют функцией-ступенькой.

Рис. 6. Пороговые активационные функции нейрона, заданные формулами: а – (3.2); б – (3.4); в – (3.5)

Таким образом, математический нейрон представляет собой пороговый элемент с несколькими входами и одним выходом. Каждый математический нейрон имеет свое определенное значение порога .

С помощью математического нейрона можно моделировать различные логические функции, например, функцию логического умножения “И” (ее также обозначают “AND”), функцию логического сложения “ИЛИ” (“OR”) и функцию логического отрицания “НЕТ” (“NOT”). Таблицы истинности этих логических функций приведены в табл. 3, в которых значение логических функций “истинно” закодировано единицей, а значение “ложно” — нулем.

Таблица 3

С помощью этих таблиц и формул (1)–(2) нетрудно убедиться, что математический нейрон (см. рис. 7), имеющий два входа с единичными силами синаптических связей w1 = w2 = 1, моделирует функцию логического умножения “И” при q = 2. Этот же нейрон моделирует функцию логического сложения “ИЛИ” при задании q = 1. Математический нейрон с одним входом моделирует функцию “НЕТ” при задании  w = -1 и q = 0.

Рис. 7. Математические нейроны, моделирующие логические функции

В современной литературе иногда вместо понятия порога чувствительности нейрона q используют термин нейронное смещение b, которое отличается от порога q только знаком: b = – q. Если его добавить к сумме (1):

,                                                   (3)

то пороговая активационная функция нейрона примет вид:

                                                (4)

Графическое представление этой активационной функции приведено на рис. 6б на с. 21. Еще более симметричный вид, представленный на рис. 6в, активационная функция нейрона приобретает при использовании формулы:

                                              (5)

В формуле (3) нейронное смещение b можно рассмат­ривать как вес w0 некоторого дополнительного входного сигнала x0, величина которого всегда равна единице:

.                                    (6)

Нейрон с дополнительным входом x0 изображен на рис. 8.

Рис. 8. Нейронное смещение b интерпретируется
как вес дополнительного входа w 0 , сигнал которого x 0 всегда равен 1

Коротко о главном

Согласно наиболее распространенным современным научным представлениям, вся информация и все знания в человеческом мозге кодируются и хранятся в виде мат­рицы сил межнейронных синаптических связей. Математический нейрон Мак-Каллока – Питтса — это математическая модель биологического нейрона мозга, учитывающая его структуру и функциональные свойства.

Рекомендации по проведению урока

Как показал опыт, рассказ о строении мозга и его функционировании обычно воспринимается учащимися с большим интересом. Здесь важно завладеть вниманием и не упускать его до конца урока-лекции. Кроме того, надо учесть, что материал урока достаточно объемен, поэтому надо сразу начать лекцию и не сбавлять темпа изложения материала до самого конца урока, оставив повторение и закрепление материала на следующий урок.

Необходимая тишина в классе воцарится сразу же после того, как вы сообщите, что мозг каждого человека (включая и слушателей) состоит из множества нервных клеток — нейронов, число которых приблизительно равно количеству звезд в нашей Галактике, что нейроны связаны между собой нервными волокнами, через которые происходит обмен электрическими сигналами.

Для лучшего понимания и усвоения материала школьникам нелишне напомнить сведения из физики. Написать на доске (а лучше попросить написать кого-нибудь из школьников) закон Ома I = U / R и дать его формулировку: “электрический ток I, протекающий через проводник, прямо пропорционален приложенной к его концам разности потенциалов (напряжению) U и обратно пропорционален электросопротивлению R этого проводника”. Вместо электросопротивления (измеряемого, как известно, в омах) в электротехнике часто используют обратную ему величину r = 1 / R, называемую электропроводностью и измеряемую в сименсах. Можно спросить школьников: какой из известных им материалов обладает наиболее высокой проводимостью, и услышать в ответ — медь, алюминий (из которых сделана электропроводка в школе и в их квартирах). Так вот, большинство ученых склонны считать, что вся хранимая в нашем мозге информация (все наши мысли, чувства, эмоции, знания) закодирована с помощью чисел, характеризующих электропроводности межнейронных соединений, точнее — с помощью величин электропроводностей синапсов — точек контакта между нервными волокнами и дендритами (см. рис. 4). Именно этот физический факт заложен в основу математической модели нейрона, предложенной в 1943 г. американскими математиками-нейрофизиологами Мак-Каллоком и Питтсом. Именно этот факт заложен в основу искусст­венных нейронных сетей, состоящих из математических нейронов. Именно этот факт заложен в основу нейрокомпьютеров, реализующих искусственные нейронные сети “в железе”. Роль электропроводностей во всех этих моделях мозга выполняют весовые коэффициенты, называемые силами синаптических связей, или синаптическими весами.

Надо, чтобы школьники и в дальнейшем помнили приведенную выше физическую трактовку. В дальнейшем они перейдут от физики к математике и будут оперировать только математическими и алгоритмическими понятиями и терминами. И надо им постоянно напоминать, что за математическими абстракциями кроется реальная физическая основа, что в виде сил синаптических связей (электропроводностей межнейронных связей) в человеческом мозге хранятся знания. В таком же виде представляются знания в искусственных нейронных сетях и нейрокомпьютерах. Именно в этом состоит принципиальное отличие нейронных сетей от экспертных систем, где знания хранятся в явном виде с помощью продукционных правил, фреймов, семантических сетей.

Давая теоретический материал о строении мозга, о попытках построения компьютера по образу и подобию мозга, надо неустанно повторять, что все это делается не для развлечения. Это делается не какими-то заумными учеными ради каких-то отдаленных и нереальных научных перспектив. Это нужно для того, чтобы научиться строить компьютерные модели мозга, чтобы научиться использовать эти модели-программы для решения практических задач, которые уже сейчас встречаются и еще не раз будут встречаться в жизни современных молодых людей. Нужно говорить о том, что в результате изучения элективного курса школьники научатся не только теоретически, но и практически владеть новым мощным суперсовременным математическим аппаратом, что они получат и освоят компьютерные программы, которые смогут применять в жизни для решения широкого круга практических задач.

В результате изучения материала урока учащиеся должны иметь представление о строении мозга и происходящих в нем процессах, знать математические формулы, которые реализует математический нейрон, и уметь вычислять его выход.

Вопросы и задания с ответами и комментариями

1. Назовите несколько отличительных признаков в принципах действия современного компьютера, выполненного по схеме фон Неймана, от мозга.

Ответ: См. табл. 2.

2. Сколько нейронов имеет человеческий мозг?

Ответ: В человеческом мозге содержится приблизительно 1011 нейронов.

3. Сколько дендритов и сколько аксонов может иметь нейрон? Каково их назначение?

Ответ: Биологический нейрон может иметь до 10 000 дендритов (через которые он принимает электрические сигналы от других нейронов) и один аксон (нервный отросток, через который нейрон передает свои выходные сигналы другим нейронам).

4. Сколько нервных волокон, соединяющих нейроны между собой, имеет человеческий мозг?

Ответ: Если учесть, что мозг человека содержит приблизительно 1011 нейронов, а каждый нейрон имеет до 10 000 дендритов (через которые он связан с 10 000 других нейронов), то, умножая эти цифры, получим, что мозг человека содержит до 1015 связей в виде нервных волокон, соединяющих нейроны между собой.

5. В каком виде хранится информация в человеческом мозге?

Ответ: Согласно распространенным нейрофизиологическим представлениям, вся информация в человеческом мозге хранится в виде матрицы сил синаптических связей.

6. Объясните на языке электротехники значение термина “сила синаптической связи”. В каких единицах она измеряется?

Ответ: Сила синаптической связи — это электропроводность проводника электрического тока, соединяющего нейроны между собой. Электропроводность (r) измеряется в сименсах и представляет собой величину, обратную электрическому сопротивлению ( R ): r = 1 / R . 1 Сименс = 1 / 1 Ом.

7. Какой объем памяти имеет человеческий мозг? Сколько чисел он может запомнить?

Ответ: Человеческий мозг содержит около 1015 межнейронных синаптических связей, каждая из которых кодирует один синаптический вес в виде десятичного числа. Как известно, для хранения одного десятичного числа требуется 1 байт информации. Следовательно, объем памяти человеческого мозга составляет около 1015 байт. Именно столько цифр он может запомнить. Естественно, что это всего лишь теоретический результат, полученный на основании гипотезы о том, что информация в человеческом мозге кодируется в виде сил синаптических связей.

8. Сколько входов и сколько выходов имеет биологический нейрон?

Ответ: Биологический нейрон имеет один выход (аксон) и до 10 000 входов (дендритов).

9. Сколько входов и сколько выходов может иметь математический нейрон Мак-Каллока – Питтса?

Ответ: Математический нейрон Мак-Каллока – Питтса имеет один выход и любое количество входов.

10. Напишите формулы, с помощью которых происходит преобразование сигналов в математическом нейроне Мак-Каллока – Питтса.

Ответ: Работа математического нейрона Мак-Каллока – Питтса описывается формулами (1)–(2).

11. Нарисуйте графическое изображение активационной функции математического нейрона Мак-Каллока – Питтса.

Ответ: См. рис. 6а.

12. Нарисуйте математические нейроны, реализующие логические функции “И”, “ИЛИ”, “НЕТ”, и приведите соответствующие им значения сил синаптических связей и порогов.

Ответ: См. рис. 7.

13. Нарисуйте математический нейрон и напишите формулы, по которым он работает, с использованием понятия смещения вместо порога. Какой вид при этом имеет активационная функция нейрона?

Ответ: См. рис. 8; формулы (3.3)–(3.6); рис. 6б, в [1].

14. Чем весовые коэффициенты отличаются от синаптических весов и от сил синаптических связей?

Ответ: Ничем. Это все синонимы.

15. Чем нейронное смещение b отличается от порога чувствительности q?

Ответ: Они различаются только знаком: b = -q.

Лабораторная работа № 1:
“Математический нейрон”

Первая лабораторная работа посвящена изучению математического нейрона Мак-Каллока – Питтса. Перед включением компьютеров школьникам рекомендуется напомнить содержание предыдущего урока — нарисовать на доске изображение математического нейрона (рис. 4) и написать формулы (1) и (2), по которым он работает. Согласно этим формулам, если взвешенная сумма входных сигналов меньше некоторой пороговой величины , то выходной сигнал равен нулю. Если же входные сигналы достаточно интенсивны и их сумма достигает порога чувствительности, то на выходе нейрона формируется сигнал . Зависимость (2) изображают графически (см. рис. 6а) и называют активационной функцией нейрона.

Напомните школьникам, что с помощью математического нейрона можно моделировать различные логические функции. Напомните им, что собой представляют логические функции “И”, “ИЛИ” и “Исключающее ИЛИ”, и нарисуйте (или попросите нарисовать школьников) на доске таблицы истинности этих функций:

Лабораторная работа состоит в следующем: школьникам предлагается попробовать вручную подобрать по два варианта параметров нейрона (величину порога и синаптические силы) так, чтобы он моделировал все эти логические функции. На предыдущем уроке некоторые варианты решения этой задачи уже приводились. Например, сообщалось, что при w1 = w2 = 1, q = 2, нейрон реализует функцию логического умножения “И”, а при задании q = 1этот же нейрон реализует функцию логического сложения “ИЛИ”. Можно подсказать эти значения параметров нейрона школьникам или дать им возможность посмотреть тетрадки или учебник. Однако лучше устроить соревнование — кто первый справится со всеми заданиями лабораторной работы, тот будет отмечен положительной оценкой.

Работа проходит в виде азартной игры, правила которой школьники быстро осваивают сами. Преподавателю рекомендуется, не делая долгих вступлений, усадить школьников за компьютеры и запустить первую лабораторную работу. Содержимое лабораторных работ рекомендуется предварительно скачать на школьные компьютеры с сайта http://www.LbAI.ru.

Школьникам надо сказать, что они должны выполнять задания, появляющиеся в “Протоколе выполнения”. Между компьютерами и школьниками завязывается диалог, который протоколируется и впоследствии может быть проверен преподавателем.

Школьникам преподносится своеобразный “сюрприз”: если с двумя первыми заданиями (моделирование функций “И” и “ИЛИ”) школьники с нескольких попыток справляются, то последнее задание (моделирование функции “Исключающее ИЛИ”) они не могут выполнить в принципе, сколько бы попыток ни делали.

Здесь авторы лабораторного практикума воспользовались известным историческим фактом, произошедшим в 50-е гг. XX в. Многие ученые тогда пытались применять нейронные сети для решения таких задач, как прогнозирование погоды и курсов валют, постановка медицинских диагнозов и др. Иногда им это удавалось, но чаще они терпели неудачу. Задачи внешне мало чем различались между собой, однако с одними из них нейросети успешно справлялись, а с другими — нет. Объяснить причины неудач никто не мог, и исследователи продолжали свои попытки, расходуя массу времени и финансовых ресурсов. И только более глубокие исследования, выполненные американскими математиками М.Минским и С.Пейпертом (которые затем изучаются на следующих уроках), помогли разобраться в причинах парадоксальных неудач.

Таким образом, школьники на собственном опыте как бы повторяют историю развития нейроинформатики.
С помощью нейрона Мак-Каллока – Питтса они с успехом решают задачи моделирования логических функций “И” и “ИЛИ”, но никак не могут решить задачу моделирования функции “Исключающее ИЛИ”, хотя внешне эти функции мало чем различаются между собой.

Разочаровавшихся школьников следует успокоить, сообщив им, что не одни они попались в ловушку. В середине XX в. решением линейно неразделимых задач, типа проблемы “Исключающего ИЛИ”, долго и безуспешно занимались многие ученые, а бизнесмены и американское правительство вкладывали в эти исследования немалые финансовые средства.

По мнению авторов лабораторного практикума, этот неудачный опыт позволяет учащимся глубоко прочувствовать проблему, задуматься над ней и в дальнейшем избегать подобных ошибок при практическом применении нейросетевых технологий.

Ниже на рисунке приведено рабочее окно 1-й лабораторной работы. Вверху в виде развернутой книги помещена кнопка вызова теоретического материала, однако лучше, если школьники его прочитают после того, как попотеют над выполнением заданий, появляющихся в “Протоколе выполнения”. Им надо предоставить возможность осваивать программный интерфейс так же, как они осваивают большинство своих программ-игрушек. Обычно они ленятся читать инструкции, а осваивают новые игры путем нажимания кнопок наугад. Так что здесь мы рекомендуем преподавателю не мешать школьникам заниматься их любимым делом. Пусть они читают задания и пытаются их выполнить, наблюдая за комментариями, появляющимися в “Протоколе выполнения”.

Рабочее окно лабораторной работы № 1

В нижней части рабочего окна приведена графическая интерпретация работы нейрона, с помощью которой можно догадаться о причинах неудач, постигающих школьников. Но это под силу только особо одаренным детям, которые встречаются крайне редко. На вопрос школьников об этих графиках можно ответить, что их суть будет объяснена на последующих уроках.

Школьников, которые первыми догадались прочитать теоретический материал и поняли, что проблему “Исключающего ИЛИ” с помощью одного математического нейрона решить невозможно, желательно отметить положительными оценками. Выполнившим лабораторную работу № 1 раньше, чем закончится урок, можно предложить начать выполнение лабораторной работы № 2.

В конце урока ученикам рекомендуется задать вопрос, почему же невозможно с помощью математического нейрона моделировать функцию “Исключающее ИЛИ”, в то время как с моделированием других, внешне мало чем отличающихся функций (“И” и “ИЛИ”) проблем не возникало. Ответ на этот очень сложный вопрос школьники (и учителя тоже) получат на следующих уроках, а пока и школьникам, и учителям предлагается просто задуматься над этим парадоксом.

В результате выполнения лабораторной работы № 1 учащиеся должны понимать принцип действия математического нейрона, уметь подбирать синапрические веса и пороги нейронов, моделирующих логические функции “И” и “ИЛИ”, знать, что не все логические функции удается моделировать с помощью математического нейрона, задуматься над объяснением этого парадокса и подумать над его преодолением.

Л.. Н.. Ясницкий

TopList