Курсовая работа
Выполнила студентка факультета математики 4 курс 4 группа Клочанова Ольга Михайловна
Российский государственный педагогический университет им. А.И. Герцена
Санкт-Петербург
2002
Введение.
История науки показывает, что логическая структура и рост каждой математической теории, начиная с определенного этапа ее развития, становятся все в большую зависимость от использования математической символики и ее усовершенствования.
Когда индийцы в V веке н. э. ввели знак нуля, они смогли оставить поразрядную систему счисления и развить абсолютную позиционную десятичную систему счисления, превосходство которой при счете если и не осознают, то повседневно используют сотни миллионов людей. Алгебра и аналитическая геометрия обязаны многим тому, что Виет и Декарт разработали основы алгебраического исчисления. Введенные Лейбницем обозначения производной и интеграла помогли развить дифференциальное и интегральное исчисление; задачи на вычисление площадей, объемов, работы силы и т. п., решение которых раньше было доступно только первоклассным математикам, стали решаться почти автоматически. Благодаря этому обозначения Лейбница получили широкое распространение и проникли во все разделы науки, где используется математический анализ.
Пример с обозначением производной и интеграла особенно ярко подтверждает правильность замечания Л. Карно, что в математике «символы не являются только записью мысли, средством ее изображения и закрепления, – нет, они воздействуют на самую мысль, они, до известной степени, направляют ее, и бывает достаточно переместить их на бумаге, согласно известным очень простым правилам, для того, чтобы безошибочно достигнуть новых истин».
В чем заключено объективное содержание математической символики? Чем объясняется значение символики в математике?
Математические знаки служат в первую очередь для точной (однозначно определенной) записи математических понятий и предложений. Их совокупность – в реальных условиях их применения математиками – составляет то, что называется математическим языком.
Использование знаков позволяет формулировать законы алгебры, а также и других математических теорий в общем виде. Примером могут послужить формулы той же алгебры: (a+b)2
= a2
+ 2ab + b2
х1,2
=и т.п.
Математические знаки позволяют записывать в компактной и легкообозримой форме предложения, выражение которых на обычном языке было бы крайне громоздким. Это способствует более глубокому осознанию их содержания, облегчает его запоминание.
Математические знаки используются в математике эффективно и без ошибок, когда они выражают точно определенные понятия, относящиеся к объектам изучения математических теорий. Поэтому, прежде чем использовать в рассуждениях и в записях те или иные знаки, математик старается сказать, что каждый из них обозначает. В противном случае его могут не понять.
В связи со сказанным необходимо подчеркнуть следующее. Математики не всегда могут сказать сразу, что отражает тот или иной символ, введенный ими для развития какой-либо математической теории, средствами которой можно решать практически важные задачи. Сотни лет математики оперировали отрицательными и комплексными числами и получали с их помощью первоклассные результаты. Однако объективный смысл этих чисел и действий с ними удалось раскрыть лишь в конце XVIII и в начале XIX века. Лейбниц ввел символы dx и dy, развил дифференциальное исчисление и с помощью правил последнего показал исключительную оперативную силу этих символов. Однако Лейбниц не выявил объективного смысла знаков dx и dy; это сделали математики XIX века.
Знаки и системы знаков играют в математике роль, весьма сходную с той, какая в более широких сферах познания и практической деятельности людей принадлежит обычному разговорному языку. Подобно обычному языку, язык математических знаков позволяет обмениваться установленными математическими истинами, налаживать контакт ученых в совместной научной работе.
Решающим, однако, является то, что язык математических знаков без обычного языка существовать не может. Обычный (естественный) язык содержательнее языка математических знаков; он необходим для построения и развития языка математических знаков. Язык математических знаков только вспомогательное средство, присоединяемое к обычному языку и используемое в математике и в областях, где применяются ее методы.
Возможность использования языка знаков в математике обусловлена особенностями предмета ее исследований – тем, что она изучает формы и отношения объектов реального мира, в известных границах безразличные к их материальному содержанию. Существенна при этом и специфика математических доказательств. Математическое доказательство состоит в построении цепи высказываний, начальным звеном которой являются истинные исходные предложения, конечным – доказываемое утверждение. Промежуточные звенья цепи получаются в конечном счете из начального и соединяются с ним и конечным звеном с помощью законов логики и правил логического вывода. Если исходные утверждения записаны в символической форме, то доказательство сводится к их «механическим» видоизменениям.
Целесообразность, а в наше время и необходимость – использования языка знаков в математике обусловлена тем, что при его помощи можно не только кратко и ясно записывать понятия и предложения математических теорий, но и развивать в них исчисления и алгоритмы – самое главное для разработки методов математики и ее приложений. Достичь этого при помощи обычного языка если и возможно, то только в принципе, но не в практике.
Достаточная оперативность символики математической теории существенно зависит от полноты символики. Это требование состоит в том, что символика должна содержать обозначения всех объектов, их отношений и связей, необходимые для разработки алгоритмов теории, позволяющих решать любые задачи из классов однотипных задач, рассматриваемых в этой теории.
Оперирование математическими знаками есть идеализированный эксперимент: он в чистом виде описывает то, что имеет место или может быть (приближенно или точно) реализовано в действительности. Только поэтому оперирование математическими знаками способно служить открытию новых математических истин.
Решающей силой развития математической символики является не «свободная воля» математиков, а требования практики математических исследований. Именно реальные математические исследования помогают математикам в конце концов выяснить, какая система знаков наилучшим образом отображает структуру рассматриваемых количественных отношений, в силу чего может быть эффективным орудием их дальнейшего изучения.
§1. Введение нуля и развитие позиционной десятичной системы счисления.
Интуитивное представление о числе, по-видимому, так же старо, как и само человечество, хотя с достоверностью проследить все ранние этапы его развития в принципе невозможно. Прежде чем человек научился считать или придумал слова для обозначения чисел, он, несомненно, владел наглядным, интуитивным представлением о числе, позволявшим ему различать одного человека и двух людей или двух и многих людей.
Названия чисел, выражающие весьма абстрактные идеи, появились, несомненно, позже, чем первые грубые символы для обозначения числа объектов в некоторой совокупности. В глубокой древности примитивные числовые записи делались в виде зарубок на палке, узлов на веревке, выложенных в ряд камешков, причем подразумевалось, что между пересчитываемыми элементами множества и символами числовой записи существует взаимно однозначное соответствие. Но для чтения таких числовых записей названия чисел непосредственно не использовались. Ныне мы с первого взгляда распознаем совокупности из двух, трех и четырех элементов; несколько труднее распознаются на взгляд наборы, состоящие из пяти, шести или семи элементов. А за этой границей установить на глаз их число практически уже невозможно, и нужен анализ либо в форме счета, либо в определенном структурировании элементов. Счет на бирках, по-видимому, был первым приемом, который использовался в подобных случаях: зарубки на бирках располагались определенными группами. Очень широко был распространен счет на пальцах, и вполне возможно, что названия некоторых чисел берут свое начало именно от этого способа подсчета.
Важная особенность счета заключается в связи названий чисел с определенной схемой счета. Например, слово «двадцать три» – не просто термин, означающий вполне определенную (по числу элементов) группу объектов; это термин составной, означающий «два раза по десять и три». Здесь отчетливо видна роль числа десять как коллективной единицы или основания; и действительно, многие считают десятками, потому что, как отметил еще Аристотель, у нас по десять пальцев на руках и на ногах.
Система счисления, которой мы в основном пользуемся сегодня, десятичная позиционная. Десятичная, так как ее основание 10. Основанием позиционной системы счисления называется возводимое в степень целое число, которое равно количеству цифр, используемых для изображения чисел в данной системе счисления. Основание показывает также, во сколько раз изменяется количественное значение цифры при перемещении ее на соседнюю позицию. В позиционных системах счисления количественный эквивалент (значение) цифры зависит от ее места (позиции) в записи числа
Десятичная система характеризуется тем, что в ней 10 единиц какого-либо разряда образуют единицу следующего старшего разряда. Другими словами, единицы различных разрядов представляют собой различные степени числа 10.
Десятичной позиционной предшествовали другие, основанные на различных принципах, системы счисления. Так примером непозиционной системы (то есть такой системы, где количественный эквивалент каждой цифры не зависит от ее положения (места, позиции) в записи числа) может служить нумерация, используемая древними греками. Эта система относится к числу алфавитных. Первыми восемью буквами греческого алфавита (с добавлением «архаичной» буквы =вау, имевшей значение 6 обозначались числа от единицы до девяти, следующими восемью с добавлением =коппы, имевшей значение 90, - десятки от 10 до 90, следующими восемью с добавлением =сампи, означавшей 900, - сотни от 100 до 900, наконец, тысячи от 1000 до 9000 обозначались так же, как единицы, но со штрихом внизу: ,a означала 1000. Для того чтобы отличать числа от слов, над ними ставилась черточка. Так, число 1305 греки записывали ,. От греческой нумерации ведет свое происхождение древнерусская. Пример другой непозиционной системы дает употребляемая поныне римская нумерация.
Мы пользуемся ею для обозначения юбилейных дат, для нумерации некоторых страниц книги (например, страниц предисловия), глав в книгах, строф в стихотворениях и т. д. В позднейшем своем виде римские цифры выглядят так: I=1; V=5; X=10; L=50; С=100; D=500; M=1000.
О происхождении римских цифр достоверных сведений нет. Цифра V могла первоначально служить изображением кисти руки, а цифра Х могла составиться из двух пятерок. Точно так же знак для 1000 мог составиться из удвоения знака для 500 (или наоборот).
Все целые числа (до 5000) записываются с помощью повторения вышеприведенных цифр. При этом если большая цифра стоит перед меньшей, то они складываются, если же меньшая стоит перед большей (в этом случае она не может повторяться), то меньшая вычитается из большей. Например, VI=6, т.е. 5+1, IV=4, т.е. 5-1, XL=40, т е. 50-10, LX=60, т.е. 50+10. Подряд одна и та же цифра ставится не более трех раз: LXX=70; LXXX=80; число 90 записывается ХС (а не LXXXX).
Первые 12 чисел записываются в римских цифрах так: I, II, III, IV, V, VI, VII, VIII. IX, X, XI, XII.
Примеры: XXVIII=28; ХХХIХ=39; CCCXCVII=397; MDCCCXVIII=1818.
Выполнение арифметических действий над многозначными числами в этой записи очень трудно. Тем не менее римская нумерация преобладала в Италии до 13 века, а в других странах Западной Европы - до 16 века.
Древние египтяне использовали десятичную непозиционную систему счисления. Единицу обозначали одной вертикальной чертой, а для обозначения чисел, меньших 10, нужно было поставить соответствующее число вертикальных штрихов. Чтобы записанные таким образом числа было легко узнавать, вертикальные штрихи иногда объединялись в группы из трех или четырех черт. Для обозначения числа 10, основания системы, египтяне вместо десяти вертикальных черт ввели новый коллективный символ, напоминающий по своим очертаниям подкову или крокетную дужку. Множество из десяти подковообразных символов, т.е. число 100, они заменили другим новым символом, напоминающим силки; десять силков, т.е. число 1000, египтяне обозначили стилизованным изображением лотоса. Продолжая в том же духе, египтяне обозначили десять лотосов согнутым пальцем, десять согнутых пальцев – волнистой линией и десять волнистых линий – фигуркой удивленного человека. В итоге древние египтяне могли представлять числа до миллиона. Так, например, с помощью коллективных символов и повторений уже введенных символов число 6789 в иероглифических обозначениях можно было бы записать как
Самые древние из дошедших до нас математических записей высечены на камне, но наиболее важные свидетельства древнеегипетской математической деятельности запечатлены на гораздо более хрупком и недолговечном материале – папирусе. Два таких документа – папирус Ринда, или египетского писца Ахмеса (ок. 1650 до н.э.) и московский папирус, или папирус Голенищева (ок. 1850 до н.э.) – служат для нас основными источниками сведений о древнеегипетских арифметике и геометрии. В этих папирусах более древнее иероглифическое письмо уступило место скорописному иератическому письму, и это изменение сопровождалось использованием нового принципа обозначения чисел. Группа одинаковых символов заменялись более простой по начертанию пометой или знаком, например, девять записывалось как вместо , а семьсот как вместо . В этой записи число 6789 имело вид , причем знаки более высокого порядка располагались справа, а не слева.
Введение египтянами цифровых обозначений ознаменовало один из важных этапов в развитии систем счисления, так как дало возможность существенно сократить записи.
Основные недостатки непозиционных систем нумерации - трудности с изображением произвольно больших чисел и, главное, более сложный, чем в позиционных системах, процесс вычислений. (Последнее, правда, облегчалось употреблением счетных досок – абаков, так что изображение чисел было необходимо лишь для конечного результата).
Крупным шагом вперед, оказавшим колоссальное влияние на все развитие математики было создание позиционных систем счисления. Первой такой системой стала вавилонская шестидесятеричная система счисления, в которой появился знак , указывающий на отсутствие разряда, выполняющего роль нашего нуля. Концевой нуль, который позволял различать, например, обозначения для 1 и 60, у вавилонян отсутствовал. Удобство вычислений в шестидесятеричной системе сделало ее популярной у греческих астрономов. К. Птолемей (II в. н.э.) при вычислениях в шестидесятеричной системе пользуется знаком «0» для обозначения отсутствующих разрядов как в середине, так и в конце числа (0, омикрон – первая буква греческого слова ovden-ничто). О вавилонской шестидесятеричной системе нам напоминает деление часа на 60 минут и минуты на 60 секунд, а также деление угла равного четырем прямым, на 360 градусов. Неудобство шестидесятеричной системы счисления в сравнении с десятичной – необходимость большого количества знаков для обозначения индивидуальных цифр (от 0 до 59), более громоздкая таблица умножения.
Создание десятичной позиционной системы счисления, одного из выдающихся достижений средневековой науки, - заслуга индийских математиков. Позиционные десятичные записи чисел встречаются в Индии с VI в. Так, в дарственной записи 595 года встречается запись числа 346 цифрами брахми º(º-3, -4, -6). Первую достоверную запись нуля в виде кружочка мы находим в изображении числа 270 в настенной записи из Гвалиора, относящейся к 876г. Иногда ноль обозначался точкой. Неясно, был ли нуль собственным изобретением индийцев; возможно, они познакомились с ним по сочинениям александрийских астрономов.
Вот какова эволюция написания индийских цифр.
§2. Символика Виета и Декарта и развитие алгебры.
2.1 Развитие алгебры до Ф. Виета.
2.1.1 Алгебра греков.
Считается, что эллины заимствовали первые сведения по геометрии у египтян, по алгебре - у вавилонян.
В древнейших египетских источниках папирусе Райнда и Московском папирусе - находим задачи на «аха» (термин «аха» означает «куча», «груда»). Имеется в виду некоторое количество, неизвестная величина, подлежащая определению) соответствующие современным линейным уравнениям, а также квадратным вида ах2
= b. В вавилонских клинописных текстах имеется большое число задач, решаемых с помощью уравнений и систем первой и второй степеней, которые записаны без символов, но в специфической терминологии. В этих текстах решаются задачи, приводящие к трехчленным квадратным уравнениям вида ах2
- bх = с или х2
- рх = q. В задачах на «аха» можно обнаружить зачатки алгебры как науки о решении уравнений.
Но если вавилоняне за два тысячелетия до нашей эры умели числовым путем решать задачи, связанные с уравнениями первой и второй степеней, то развитие алгебры в трудах Евклида (365 - ок. 300 гг. до н. э.), Архимеда (287-212 гг. до н. э.) и Аполлония (ок. 260-170 гг. до н. э.) носило совершенно иной характер: греки оперировали отрезками, площадями, объемами, а не числами. Их алгебра строилась на основе геометрии и выросла из проблем геометрии. В XIX в. совокупность приемов древних получила название геометрической алгебры.
В качестве примера геометрической алгебры греков рассмотрим решение уравнения х2
+ ax = b2
.
Античные математики решали эту задачу построением и строили искомый отрезок так, как показано на рисунке.
На заданном отрезке АВ (равном a) строили прямоугольник AMсо сторонами (а + х) и x, равновеликий данному квадрату (b2
), таким образом, чтобы избыточная над прямоугольником AL (равная ах) площадь ВМ была квадратом, по площади равным х2
. Сторона этого квадрата и давала искомую величину х. Такое построение называли гиперболическим приложением площади.
Далее, полагая задачу решенной, делили АВ пополам точкой С, на отрезке LM строили прямоугольник MG, равный прямоугольнику ЕС. Тогда прямоугольник AM будет разностью квадратов DF и LF. Эта разность и квадрат LF известны, поэтому по теореме Пифагора можно получить квадрат DF. После этого находили величину DC(равную ½a +x) и DB (равную х).
Геометрическое построение в точности соответствует преобразованию, с помощью которого в современных обозначениях решается уравнение указанного типа:
b2
= ax + х2
= –
Конечно же, при таких построениях отыскивались только положительные корни уравнений: отрицательные числа появились в математике значительно позже.
С помощью геометрии древним удавалось также доказывать многие алгебраические тождества. Но каковы эти доказательства! Они безупречны в отношении логики и слишком громоздки. Вот как формулирует Евклид теорему, выражающую тождество (а + b)2
= a2
+ 2аb +b2
. Если отрезок (ab) разделен в точке (g) на два отрезка, то квадрат, построенный на (ab), равен двум квадратам на отрезках (ag, gb) вместе с удвоенным прямоугольником на (ag, gb).
Естественно, связывая число с геометрическим образом (линией, поверхностью, телом), древние оперировали только однородными величинами; так, равенство было возможно для величин одинакового измерения.
Такое построение математики позволило античным ученым достигнуть существенных результатов в обосновании теорем и правил алгебры, но в дальнейшем оно стало сковывать развитие науки.
Приведенные примеры могут создать ощущение, что математика древних греков примитивна. Но это не так: созданная ими математика по своему идейному содержанию глубока и питала идеями и методами математику вплоть до XVII в. - века научной революции; многие идеи древних получили дальнейшее развитие в новой математике, созданной усилиями выдающихся умов XVI—XVII вв.
Накопленные в странах Древнего Востока знания состояли из набора разрозненных математических фактов, рецептур для решения некоторых конкретных задач и не могли обладать достаточной строгостью и достоверностью. Создание основ математики в том виде, к которому мы привыкли при изучении этой науки в школе, выпало на долю греков и относится к VI—V вв. до н. э. С этого времени начала развиваться дедуктивная математика, построенная на строгих логических доказательствах.
2.1.2 Алгебра Диофанта.
Новый подъем античной математики относится к III в. н. э., он связан с творчеством великого математика Диофанта. Диофант возродил и развил числовую алгебру вавилонян, освободив ее от геометрических построений, которыми пользовались греки.
У Диофанта впервые появляется буквенная символика. Он ввел обозначения: неизвестной z, квадрата d), куба c, четвертой dd (квадратоквадрат), пятой dc (квадратокуб) и шестой степеней ее, а также первых шести отрицательных степеней, т. е. рассматривал, величины, записываемые нами в виде x6
, x5
, x4
, x3
, x2
, x, x-1
, x-2
, x-3
, x-4
, x-5
, x-6
. Диофант применял знак равенства (символ i) и знак для обозначения вычитания.
Диофант сформулировал правила алгебраических опeраций со степенями неизвестной, соответствующие нашим умножению и делению степеней с натуральными показателями (для m + n 6), и правила знаков при умножении. Это дало возможность компактно записывать многочлены, производить умножение их, оперировать с уравнениями. Он указал также правила переноса отрицательных членов уравнения в другую часть его с обратными заиками, взаимного уничтожения одинаковых членов в обеих частях уравнения.
«Арифметика» посвящена проблеме решения неопределенных уравнений. И хотя Диофант считает число собранием (а это означает, что рассматриваются только натуральные числа), при решении неопределенных уравнений он не ограничивается натуральными числами, а отыскивает и положительные рациональные решения.
Неопределенными уравнениями до Диофанта занимались математики школы Пифагора в связи с пифагоровой теоремой. Они искали тройки целых положительных чисел, удовлетворяющих уравнению x2
+ y2
= z2
.
Диофант поставил задачу установить разрешимость (в рациональных числах) и в случае разрешимости найти рациональные решения уравнения F (х, у) = 0, где левая часть – многочлен с целыми или рациональными коэффициентами. Он исследовал неопределенные уравнения второй, третьей и четвертой степеней и системы неопределенных уравнений.
Во второй книге «Арифметики» он так исследует, например, уравнение второго порядка F (х, у) = 0.
Это уравнение задает коническое сечение. Всякому рациональному решению уравнения соответствует точка кривой с рациональными координатами. Пусть a, b– такие координаты, т. е. F (a, b) = 0.
Диофант делает подстановку у = b + k (х – а), или y = b + kt, х = а + t.
ТогдаF (а + t, b + kt) = F (a, b) + tA (а, b) + ktB (а, b) + t2
C (a, b, k) = 0.
Но F (a, b) = 0, поэтому t = –.
Это означает, что каждому рациональному значению параметра k соответствует рациональное же значение t, а значит, рациональная точка кривой. Очевиден геометрический смысл решения: через рациональную точку кривой (a, b) проводится прямая y – b =k (x – a) и находятся вторая точка ее пересечения с кривой.
Методы Диофанта впоследствии применяли и развивали арабские ученые, Виет (1540—1603), Ферма, Эйлер (1707—1783), Якоби (1804—1851), Пуанкаре (1854—1912).
Оценивая творчество Диофанта, Цейтен отмечает существенную деталь: «Наконец, мы желаем здесь вкратце указать на важную роль, сыгранную впоследствии сочинениями Диофанта. Благодаря тому, что определенные уравнения первой и второй степени были облечены у него в численную оболочку они оказались гораздо более доступными для людей, не посвященных еще в культуру греческой математики; более доступными, чем те абстрактные геометрические формы, которые принимают у Евклида уравнения второй степени и которые мы встречаем в сохранившихся до нас трудах других геометров для выражения уравнений первых двух степеней. Поэтому Диофант и явился главным посредником в процессе усвоения греческой алгебры арабами, благодаря которым, в свою очередь она проникла в Европу в эпоху возрождения наук».
2.1.3 Алгебра индусов.
Начиная с V в. центр математической культуры переместился на восток - к индусам и арабам. Математика индусов резко отличалась от математики греков она была числовой. Индусы не были озабочены строгостью эллинов в доказательствах и обосновании геометрии. Они довольствовались чертежами, на которых у греков основывалось доказательство, сопровождая их указанием: «Смотри!». Предполагается, что благодаря числовым выкладкам и практическому эмпиризму индусам удалось постичь теоремы и методы греков, теоретического обоснования которых они, возможно, по-настоящему не понимали.
Основные достижения индусов состоят в том, что они ввели в обращение цифры, называемые нами арабскими, и позиционную систему записи чисел, обнаружили двойственность корней квадратного уравнения, двузначность квадратного корня и ввели отрицательные числа.
Индусы рассматривали числа безотносительно к геометрии. В этом их алгебра имеет сходство с алгеброй Диофанта. Они распространили правила действия над рациональными числами на числа иррациональные, производя над ними непосредственные выкладки, а не прибегая к построениям, как это делали греки. Например, им было известно, что
Греки, не знавшие отрицательных чисел, решая уравнения, преобразовывали их так, чтобы обе части уравнения при значении неизвестной, удовлетворяющей этому уравнению, были положительными. Если этого не происходило, то менялись условия задачи. Индусы в аналогичных ситуациях не были стеснены в своих действиях: они либо отбрасывали получающиеся отрицательные решения, либо интерпретировали их как долг, задолженность. Отсюда сделан был естественный шаг к установлению правил действий над величинами при любом выборе знаков этих величин, а также к выявлению наличия двух корней у квадратных уравнений и двузначности квадратного корня.
Индусами был сделан шаг вперед по сравнению с Диофантом и в совершенствовании алгебраической символики: они ввели обозначения нескольких различных неизвестных и их степеней, которые были, как у Диофанта, по сути дела сокращениями слов. Кроме того, они искали решения неопределенных уравнений не в рациональных, а в целых числах.
2.1.4 Алгебра арабов.
Дальнейшее развитие математика получила у арабов, завоевавших в VII в. Переднюю Азию, Северную Африку и Испанию. Создались благоприятные условия для слияния двух культур – восточной и западной, для усвоения арабами богатого математического наследия эллинов и индусской арифметики и алгебры.
Но еще до того как началось усиленное изучение арабами трудов древних математиков, в 820 г., вышел трактат по алгебре «Краткая книга об исчислении ал-джабра и ал-мукабалы» Мухаммеда ибн Муса ал-Хорезми (т. е. из Хорезма, 787 – ок. 850г. н. э.), где давались числовое и геометрическое решения уравнений первой и второй степеней.
Название трактата соответствует операциям при решении уравнений: «ал-джабр» (восстанавливать) означает восстановление отрицательного члена в одной части уравнения в виде положительного в другой. Например, преобразовав уравнение
2х2
+ Зх -2 = 2х к виду 2х2
+ Зх = 2х + 2, мы произвели операцию ал-джабр.
«Ал-мукабала» означает сопоставление подобных членов, приведение их к одному; в нашем уравнении подобные члены Зх и 2х, поэтому получим 2x2
+ x = 2.
Модификация слова ал-джабр породила более позднее алгебра. Аналогично, слово алгорифм (алгоритм) произошло от ал-Хорезми.
Основное внимание в трактате ал-Хорезми обращает на решение уравнений вида
ax2
= bx, ax2
= c, ax2
+ bx = c, ax2
+ c = bx, bx + c = ax2
, bx = c,
которые формулирует словесно, например, так: «квадраты и корни равны числу» (ах2
+ bх = с). Он высказывает правила, дающие только положительные решения уравнений, определяет условия, при которых эти решения существуют. Обоснование правил ал-Хорезми дает в духе геометрической алгебры древних.
От арабов Европа получила следующий способ решения уравнения
х2
+ ах = b.
Построим квадрат х2
, к его сторонам приложим четырехугольники длины х + 2а/4 = х + а/2 и ширины а/4. Тогда площадь полученного квадрата = x2
+ ax + .
Значит, x2
+ ax + = = b + , = b + .
Величины b и а известны, поэтому можно построить , откуда х + = -. Впрочем, ал-Хорезми, приведший в своем сочинении этот метод, уравнению ах2
+ с = bх приписывал два корня.
В трактате приведены некоторые сведения о действиях над алгебраическими выражениями, примеры решения треугольников много задач о разделе наследства приводящих к уравнениям первой степени. Таким образом, трактат ал-Хорезми не содержал ничего нового по сравнению с тем, что было у греческих авторов и индусов, но он заслуживает внимания потому, что в течение длительного времени был руководством, по которому велось обучение в Европе.
2.1.5 Развитие алгебры в Европе.
Каково же было состояние математики в это время в Европе. Об этом наука располагает крайне скудными сведениями.
В XII – XIII вв. в Европе интенсивно переводились в арабского языка как труды самих арабов, так и работы древних греков, переведенные на арабский язык.
Первым европейским математиком, которому удалось осветить многие вопросы и внести в математику свой вклад, был Леонардо Пизанский (Фибоначчи, 1180–1240), написавший «Книгу абака». В ней рассмотрены различные задачи, указаны методы их решения, причем арифметика и алгебра линейных и квадратных уравнений изложены с небывалой до этого времени точностью и полнотой.
Существо задачи Леонардо излагает словесно; неизвестную он называет res (вещь) или radix (корень); квадрат неизвестной – census (имущество) или quadratus (квадрат); данное число – numerus. Все это латинские пероводы соответствующих латинских слов.
Современник Леонардо, Иордан Неморарий (XIII в), употреблял буквенные обозначения более систематично и решал задачи с применением линейных и квадратных уравнений, сначала в общем виде, а затем иллюстрировал их числовыми примерами.
Французский епископ Николь Орем (1323-1382) рассматривал «дробно – рациональные отношения», соответствующе современным степеням a½
, a¼
, a3/2
и т.д., сформулировал правила операций с этими отношениями типа , , , ,
Орем вплотную подошел к понятию иррационального показателя. Он доказал расходимость гармонического ряда 1 + +++…
Выдающимся алгебраистом своего времени стал монах-францисканец Лука Пачоли (ок. 1445 – ок.1514) близкий друг Леонардо да Винчи, работавший профессором Математики в университетах и различных учебных заведениях Рима, Болоньи, Неаполя, Флоренции, Милана и других городов.
Он ввел «алгебраические буквы» (caratterialgebraici), дал обозначения квадратному и кубическому корням, корню четвертой степени; неизвестную х он обозначал со (cosa – вещь), х2
– се (censo - квадрат, от латинского census), х3
– cu (cubo), x4
– се. се. (censo de censo), x5
– р°г° (primo relato – «первоеrelato», x6
– р°г° х – се. cu. (censo de «второеrelato»), х8
– ce. ce. ce. (de censo), x9
– cu. cu. (cubo de cubo), x10
– ce. p°r° (censo de primo relato), x13
– 3°r° (tersio relato - «третье relato») ит. д.; свободныйчленуравнения– n° (numero – число). Как видим, некоторые степени Пачоли получал мультипликативным способом с помощью показателей 2 и 3 (х4
= х2
×2
, х6
= х2
×3
, х9
= х3
×3
и т. д.), а в случаях, когда так не получалось, пользовался словом relato (например, при образовании х5
, х7
, х11
и т. д.). Специальными символами Пачоли обозначил вторую неизвестную и ее степени. Для обозначения операции сложения он воспользовался знаком (plus – больше), для обозначения вычитания – знаком (minus – меньше). Он сформулировал правила умножения чисел, перед которыми стоят знаки и .
Раздел «Суммы», посвященный алгебраическим уравнениям, Пачоли закончил замечанием о том, что для решения кубических уравнений х3
+ ах = b и х3
+ b = ах «искусство алгебры еще не дало способа, как не дан еще способ квадратуры круга».
Некоторый шаг в совершенствовании алгебраической символики сделал бакалавр медицины Н. Шюке (ум. ок. 1500 г.), который в книге «Наука о числах в трех частях» изложил правила действий с рациональными и иррациональными числами и теорию уравнений. Для сложения и вычитания он вслед за Пачоли пользовался знаками и , причем, знак служил и для обозначения отрицательного числа. Неизвестную величину он называл premier («первое число»), а ее степени – вторыми, третьими и т. д, числами. Записи степеней неизвестной у Шюке лаконичны. Например, современные символы 5, 5ж, 5х, 5х2
, 5х3
у него выглядели бы так: 5°, 51
, 52
, 53
. Вместо равенства 8х3
×7х-1
= 56х2
Шюке писал: «83
, умноженное на 71
×
, дает 562
». Таким образом, он рассматривал и отрицательные показатели. Относительно свободных членов уравнения Шюке указывал, что эти числа «имеют имя нуль».
Значительного успеха в совершенствовании «алгебраических букв» Луки Пачоли достигли немецкие алгебраисты – «коссисты». Они вместо и ввели знаки + и –, знаки для неизвестной, и ее степеней, свободного члена.
XVI в. в алгебре ознаменовался величайшим открытием – решением в общем виде уравнений третьей и четвертой степеней.
Спицион дель Ферро в 1506 г. нашел решение кубического уравнения вида
x3
+ ax = ba,b >0. (1)
Чуть позже Тарталья указал решение этого же уравнения в виде х = - , где u – v = b, uv = , откуда u и v находятся как корни квадратного уравнения.
Также он нашел решение уравнения x3
= ax + ba,b >0 (2)
в виде х = + , где u + v = b, uv = .
Уравнение же x3
+ b = axa,b >0 можно решить с помощью уравнения (2).
В те времена предпочитали избегать отрицательных корней и задачи, сводящиеся к отрицательным корням уравнения (2), преобразовывали так, чтобы они приводили к положительным корням уравнения (3). Лишь Кардано позже осознал выгоду рассмотрения отрицательных корней.
Почему рассматривались только уравнения вида (1) и (2)? На этот вопрос ответ дал Кардано.
Чтобы разобраться в нем, рассмотрим полное уравнение третьей степени.
y3
+ ay2
+ by + c = 0.
Не следует думать, что Тарталья и Кардано писали такие уравнения. Нет, так стали поступать гораздо позже. Записывать все члены уравнения в одной части, приравнивая к одной части, начал Декарт. Да и символики не было, пользовались прообразами символов и словами. Уравнение x3
+ ax = b записывалось примерно так: «куб» (х3
) некоторое количество (а) «вещей» (х) равно данному «числу» (b). Понять можно, но оперировать сложно.
Полное уравнение можно преобразовать в неполное, не содержащее члена с квадратом неизвестной. Сделаем замену y = x + a и подставим в уравнение; получим х3
+ (3a + а)х2
+ (3a2
+ 2aа + b)x + (a3
+ aa2
+ ba + c) = 0.
Положим 3a + а = 0. Найдем отсюда a = - а/3 и подставим в выражения
p = 3a2
+ 2aа + b, q = a3
+ аa2
+ ba + c.
Тогда уравнение примет вид х3
+ px + q = 0.
В нашей символике это уравнение соответствует уравнениям (1), (2), которые решал Тарталья.
Кардано узнал способ решения уравнений третьей степени, предложенный Тартальи, опубликовал его. Формула же стала носить название «формулы Кардано».
Выведем теперь ее.
Рассмотрим уравнение х3
+ px+ q = 0. Введем новые неизвестные x = u + v и подставим их в исходное уравнение; получим u3
+ v3
+ (3uv + p)(u + v) + q = 0.
Приравняем 3uv + p к нулю: 3uv + p = 0.
Уравнение примет вид u3
+ v3
+ q = 0. Тогда uv = – , u3
v3
= – , u3
+ v3
= -q.
Выражения u3
и v3
можно принять за корни квадратного уравнения z2
+ qz – = 0.
Решая его, получим z1
= – + , z2
= – – .
Таким образом, x = u + v = +, x =+.
Это и есть формула Кардано. Не лишне заметить, что в таком виде Кардано ее не искал: он формулировал решение уравнений (1) и (2) и рассматривал связь между уравнениями (2) и (3).
В случае, когда +<0, под квадратным корнем получается отрицательное число и корень дает мнимость. Этот случай получил название неприводимого, так как решение уравнения третьей степени не приводится к решению квадратного уравнения. Как уже говорилось, с ним не справились ни Тарталья, ни Кардано. Его с помощью тригонометрии разобрал Виет.
Чтобы получить представление о символике Кардано, приведем пример записи корня кубического уравнения x3
+ 6x = 20. Выражение записывалось так Rx
.u.cu.Rx
.10810½Rx
.u.cu.Rx
.10810.
Здесь Rx
– знак корня (Radix), Rx
.u.cu означает корень кубический из всего выражения до вертикальной черты или после нее, и - сокращения слов plus и minus.
Кардано показал, что легко можно решить уравнение x4
ax = bx2
+ . Он привел его к виду x4
= b(x)2
, а затем извлечением корня получил квадратное уравнение. Аналогично он рассматривал и некоторые другие виды уравнений.
Однако уравнение x4
+ 6x2
+ 36 = 60x, предложенное да Кои Кардано не сумел решить.
Открыл метод решения уравнений четвертой степени 23 – летний ученик Кардано – Луиджи Феррари.
После того, как были исследованы уравнения третьей степени, задача об уравнениях четвертой степени стала более легкой. Феррари рассматривал уравнение, не содержащее члена с x3
, т.е. уравнение вида x4
+ ax2
+ bx + c = 0.
Он преобразовывал его так, чтобы в левой части был полный квадрат, а в правой – выражение не выше второй степени относительно x.
Выделением полного квадрата получалось = x4
+ ax += -bx – c + , = -bx – c + .
Теперь следовало выполнить такие преобразования, чтобы из левой и правой частей можно было извлечь корень. С этой целью Феррари вводил новую переменную t и прибавлял к обеим частям выражение 2t + t2
. Этодает= 2tx2
– bx – c + at + + t2
, = 2tx2
– bx + (– c + + at + t2
).
Нужно, чтобы правая часть была полным квадратом. Вспомним, как обстоит дело с трехчленом ax2
+ bx + c. Выделим в нем полный квадрат: ax2
+ bx + c = а(x2
+ x + ) = =a(x2
+ 2x× + - +) = a(x2
+ 2x× + + ) = a(x+)2
+ .
Трехчлен будет полным квадратом, когда 4ac – b2
= 0. В нашем случае роль коэффициента при x2
играет 2t, а роль свободного члена - выражение в скобках правой части уравнения. Тогда выражению 4ac – b2
= 0 соответствует 4×2t(t2
+ at + - c) – b2
= 0, b2
= 2t(4t2
+ 4at + a2
- 4c).
Таким образом, нахождение t свелось к решению кубического уравнения, а x находится з квадратного уравнения после извлечения корня из левой и правой частей, т.е. из уравнения x2
+ + t0
= .
Кардано отмечает, что таким же приемом можно решать уравнения, в которых отсутствует член не с третьей степенью х, а с первой. В этом случае делается подстановка х = k/y.
Открытия, сделанные итальянцами в алгебре и систематически изложенные Кардано, стали доступны математикам других стран и дали импульс развитию науки.
Дальнейшее развитие алгебры было связано с совершенствованием символики и разработкой общих методов решения уравнений.
В этом преуспел Франсуа Виета.
2.2 Символика Виета и развитие алгебры.
Виет считается одним из основоположников алгебры. Но его интерес к алгебре первоначально связан с возможными приложениями к тригонометрии и геометрии. А задачи тригонометрии и геометрии, в свою очередь, приводили Виета к важным алгебраическим обобщениям. Так было, например, с решением уравнений третьей степени в неприводимом случае и с исследованием некоторых классов разрешимых алгебраических уравнений высших степеней.
Свою алгебру Виет ценил очень высоко. Он не пользовался словом «алгебра», эту науку он зазывал «искусством анализа». Виет различал видовую логистику и числовую логистику. Термин «логистика» означает совокупность арифметических приемов вычислений, «вид» имел смысл символа.
Видовая логистика Виета после внесенных им в символику усовершенствований представляла собой буквенное исчисление. Ее объектами служат геометрические и псевдогеометрические образы, связанные между собой различными соотношениями. Виет был последователем древних: он оперировал такими величинами, как сторона, квадрат, куб, квадратоквадрат, квадратокуб , и т. д., образующими своеобразную лестницу скаляров. Действия над скалярами у Виета, как и у древних геометров, подчинены «закону однородности»: составленные из неизвестных и известных величин уравнения должны быть однородными относительно всех их вместе взятых. Умножению чисел у Виета соответствует образование нового скаляра, размерность которого равна сумме размерностей множителей. Операция, соответствующая делению чисел, дает новую величину, размерность которой равна разности размерностей.
Виет разработал символику, в которой наравне с обозначением неизвестных впервые появились знаки для произвольных величин, называемых в настоящее время параметрами. Для обозначения скаляров он предложил пользоваться прописными буквами: «искомые величины будут обозначены буквой А или другой гласной Е, I, О, U, Y, а данные – буквами B, D, G или другими согласными»
Слово «коэффициент» введено Виетом. Рассматривая выражение
(А + В)2
+ D(A + В),
он назвал величину D, участвующую с А + В в образовании площади, longitudeciefficiens, т. е. содействующей длиной.
Из знаков Виет употреблял +, — и дробную черту. Современные скобки у него заменяла общая черта на всем выражением.
Символика Виета страдала недостатками, в некоторых отношениях она была менее совершенна, чем у его предшественников и современников. Виет для записи действий употреблял слова: in у него означало умножение, aequatur заменяло знак равенства. Словами же выражались степени различных величин. Для трех низших степеней он взял названия из геометрии, например, А3
называл Acubus. Высшим степеням он давал геометрические наименования, происходящие от низших: А9
, например,— Acubo-cubo-cubus. Известная величина В представлялась как величина девятой степени записью solido-solido-solidum. Если сторона (latus) умножается на неизвестную величину, то она называется содействующей) (coefficiens) при образовании площади.
Уравнение А3
+ 3ВА = DВиет записывал так: А cubus + В planumin 43aequaturDsolido, а уравнение ВАn
–Аm+
n
= Z так:
В parabolain Аgradum — АpotestateaequaturZhomogenae (В, умноженное на градус А, минус А в степени равняется однородной Z),
Обозначения в числовой логистике выглядели проще:
N – первая степень, Q – квадрат, С – куб и т. д. Уравнение x3
- 3x = 1 записывалось в виде 1С – 3Naequatur 1»
Неудобства символики Виета связаны и с требованием однородности. Как и древние греки, Виет считал, что сторону можно складывать только со стороной, квадрат – с квадратом, куб – с кубом и т. д. В связи с этим возникал законный вопрос: имеют ли право на существование уравнения выше третьей степени, поскольку в пространственном мире четвертая, пятая и т. д. степени аналогов не имеют.
Для придания уравнению однородности Виет после входящих в него параметров писал planum (плоскость), solidum (тело) и т. д. Вот как выглядит в записи Виета уравнение х3
+ ЗВ2
х = 2z3
: Acubus + В plano 3 inAaequariZsolido 2.
Правило Тартальи для решения уравнения третьей степени у Виета имело вид:
.
Символики Виета придерживался впоследствии П. Ферма. От «тирании» однородности просто и остроумно сумел освободиться Декарт (об этом будет сказано дальше).
Может показаться, что Виет ввел в символику алгебры совсем немного. Буквами для обозначения отрезков пользовались еще Евклид и Архимед, их успешно применяли Леонардо Пизанский, Иордан Неморарий, Николай Орем, Лука Пачоли, Кардано, Бомбелли и многие другие математики. Но сделал существенный шаг вперед Виет. Его символика позволила не только решать конкретные задачи, но и находить общие закономерности и полностью обосновывать их. Это, в свою очередь, способствовало выделению алгебры в самостоятельную ветвь математики, не зависящую от геометрии. «Это нововведение (обозначение буквами данных и искомых) и особенно применение буквенных коэффициентов положило начало коренному перелому в развитии алгебры: только теперь стало возможным алгебраическое исчисление как система формул, как оперативный алгоритм».
Сказанное, легко подтвердить примерами. Пусть х1
, x2
– корни квадратного уравнения. Перемножим разности x – x1
и х – х2
: (x – x1
)(х – х2
)=х2
– (х1
+ х2
)х + х1
х2
.
Обозначим (x – x1
)(х – х2
) = х2
+ px + q, сравнивая с предыдущим, получим p = – (х1
+ х2
), q = x1
x2
.
Выполним то же самое для кубического уравнения:
(x – x1
)(х – х2
)(x – x3
)=x3
– (х1
+ х2
+ x3
)x2
+ (x1
x2
+ x1
x3
+ x2
x3
)x – x1
x2
x3
.
Сравним результат с выражением (x – x1
)(х – х2
)(x – x3
) = x3
+ a1
x2
+ a2
x + a3
.
Это дает a1
= – (x1
+ x2
+ x3
)
a2
= x1
x2
+ x1
x3
+ x2
x3
a3
= – x1
x2
x3
.
Такой результат для квадратного уравнения был известен Кардано (в случае положительных корней – еще и раньше); Кардано отметил свойство корней кубического уравнения относительно коэффициента при х2
. Но никакого обоснования в общем виде дать он не мог; это сделал Виет для уравнений до пятой степени включительно.
Преимущества символики предоставили Виету возможность не только получить новые результаты, но и более полно и обоснованно изложить все известное ранее. И если предшественники Виета высказывали некоторые правила, рецептуры для решений конкретных задач и иллюстрировали их примерами, то Виет дал полное изложение вопросов, связанных с решением уравнений первых четырех степеней.
Рассмотрим ход рассуждений Виета при решении кубического уравнения.
Возьмем уравнение x3
+ 3ax = 2b. Положим a = t2
+ xt.
Найдем отсюда
х = и подставим в исходное уравнение. Получим + 3a = 2b, откуда для определения t наводим квадратное уравнение относительно t3
: (t3
)2
+ 2bt3
– а3
== 0.
Отсюда определится t, а затем и х. Заметим еще, что подстановка а = t2
+ xt приводит исходное уравнение к виду
(х + t)3
– t3
= 2b,
которое вместе с уравнением (х + t)t = a, (х + t)3
t3
= a3
дало бы возможность применить метод Тартальи и дель Ферро. Но Виет таким путем не пошел.
Рассмотрим теперь пример. Найдем методом Виета действительный корень уравнения
х3
+ 24x=56.
Здесь а=8, b=28. Запишем уравнение относительно t: (t3
)2
+ 56t3
- 83
- 0.
Решим его:
t3
= –28 = – 2836 t1
= = 2 t2
= = –4.
Найдем теперь х:
x1
= = –2 , x2
= = 2 = x1
.
При изложении метода Феррари для решения уравнения четвертой степени Виет провел аналитически выкладки, указанные выше, и получил уравнение, содержащее основную неизвестную А и вспомогательную Е (х и t у Феррари).
Виет, верный последователь древних, оперировал только рациональными положительными числами, которые он обозначал буквами. Если в результате подстановки в уравнение значений параметров неизвестное оказывалось иррациональным, он давал этому случаю особое обоснование.
В качестве примера такого обоснования приведем «геометрическое» решение кубического уравнения по способу дель Ферро – Тартальи.
В записи Виета уравнение имело вид A3
+ 3BA = D.
Известное решение: А является разностью «сторон» которые образуют площадь В и разность кубов которых равна D. Если обозначить «стороны» буквами u и v, то uv = B,u3
– u3
=D, A=u–v.
Виет придавал решению «геометрическое» толкование; он вместо Dsolidum записывал произведение В planum на D, т. е. получал уравнение A3
+ 3ВA=BD.
Затем он определял четыре величины, образующие «геометрический ряд», так, чтобы прямоугольник, построенный на средних или на крайних, по площади равнялся В, а разность крайних была D. Тогда A будет разностью средних.
Поясним сказанное. Обозначим эти четыре величины через z,u, v и t. Тогда можно записать
z:u = u:v = v:t, zt = uv = B, z – t = D, A = u – v.
Если в решении Тартальи D заменить на BD, то оба решения совпадут.
Способ Виета означает замену кубического корня двумя средними геометрическими, что полностью соответствует духу древних греков.
Из получившихся пропорций найдем
u3
= z2
t, v3
= ztu3
– v3
= zt(z – t) = BD
Виет особо рассматривал трехчленные уравнения различных степеней и в первую очередь интересовался количеством их корней, имея в виду только положительные корни. Отрицательные корни он определял как корни уравнения, в котором неизвестное х заменено на –у. Виет , получал трехчленные уравнения из квадратных; он поступал так, чтобы число положительных корней оставалось прежним. При этом он пользовался подстановкой х = kym
или специальными приемами.
Один из приемов Виета выглядит так. Пусть дано уравнение
x2
+ ах = b, а, b>0.
Для получения уравнения четвертой степени возведем левую и правую части уравнения в квадрат:
(х2
+ах - b)3
= x4
+ a2
x2
+ b2
+ 2ax3
– 2bx2
– 2abx = 0
Полученное уравнение можно переписать:
x4
+ 2ах3
+ 2а2
x2
– а2
x2
+b2
– 2bх2
– 2abx = 0.
Исключим 2ах3
+ 2a2
x2
, воспользовавшись тем, что b= х2
+ ax:
2ах(х2
+ аx) = b2аx, 2ах3
+ 2a2
x = 2abx.
Тогда x4
+ 2abx – а2
x2
+b2
– 2bx2
– 2abx = 0, x4
–a2
x2
+b2
– 2bx2
= 0.
Теперь осталось исключить x2
; из исходного уравнения найдем: x2
= b – ax и подставим в последнее:
x4
– (a2
+ 2b)x2
+ b2
= 0, x4
– (a2
+ 2b)(b – ax) + b2
= 0, x4
+ (2ab + a3
)x = b2
+ a2
b
Полученное уравнение четвертой степени имеет те и только те положительные корни, которые были у исходного квадратного.
Для нахождения трехчленного уравнения третьей степени Виет в качестве исходного брал уравнение
ax– x2
= ab
и умножал его левую и правую части на х + b; это при водило к уравнению
(а – b)х2
– х3
= ab2
с теми же положительными корнями, которые были у квадратного.
И еще один частный вопрос рассмотрел Виет. В уравнении
ахm
– xm
+
n
= b
имеющем по условию два корня, он определил коэффициенты, при которых корни уравнения имели бы заданные значения.
Пусть эти корни у и z. Тогда
a =, b =
Ту же задачу он решил относительно уравнения
xm
+
n
+ axm
=b, где m + n – число четное, m – нечетное.
Чрезвычайно важно то, что Виет распространил известные ранее частные преобразования на все алгебраические уравнения. Подстановку х = у + k, применявшуюся Кардано для исключения из кубического уравнения члена второй степени, он применил к уравнениям любой степени. Также известную Кардано обратную подстановку х = k/y Виет употреблял, чтобы освободиться в некоторых случаях от отрицательных коэффициентов и иррациональностей. Например, уравнение х4
– 8х = подстановкой х = он преобразовал к виду y4
+ 8у3
= 80. Подстановкой х = y Виет преобразовывал уравнение n-й степени так, что коэффициент при члене (n -1)-й степени (a) становился равным b, в то время как старший коэффициент оставался равным единице. Подстановку х = ky он применял, чтобы избавиться от дробных коэффициентов.
Особый интерес представляет исследование Виета по составлению уравнений из линейных множителей и по установлению связей между корнями уравнения и его коэффициентами. Первоначальные сведения и по тому, и по другому вопросу были у Кардано.
Кардано в ту пору, когда еще не знал метода дель Ферро и Тартальи, решал некоторые уравнения третьей степени разложением на множители. В уравнении
2х3
+ 4x2
+ 25 =l6x + 55
с этой целью он прибавлял к обеим частям 2x2
+ 10x + 5. Затем преобразовывал его к виду (2х + 6)(х2
+ 5) = (х + 10)(2х + 6), сокращал на 2х + 6 и получал квадратное уравнение.
Кардано же при нахождении положительного корня уравнения х3
+ b= ах складывал егопочленно с уравнением у3
= ay + b, получал из них квадратное уравнение делением на х минус известный отрицательный корень х – (–у). Такое преобразование позволило Кардано установить, что коэффициент при члене второй степени в правой части кубического уравнения равен сумме его корней. Это был первый шаг к установлению зависимости между корнями и коэффициентами алгебраического уравнения.
Виет составил полные уравнения с заданными положительными корнями вплоть до пятой степени и показал, как образуются коэффициенты при xn
-1
, xn
-2
, xn
-3
, ... Он установил, что эти коэффициенты при условии, что старший коэффициент равен 1 или –1 (свободный член в правой части должен был стоять со знаком +), представляют собой взятые с чередующимися знаками суммы: самих корней, парных произведений их, произведений корней, взятых по три, и т. д. Работа, в которой Виет подробно рассмотрел это утверждение, до нас не дошла. Неизвестно, как он поступал в том случае, когда уравнение имеет и отрицательные корни. Но, скорее всего, это не представляло для Виета особых трудностей: достаточно было сделать в уравнении замену х = –у и можно оперировать с положительными корнями нового уравнения. Такие примеры в его работах встречались. Если уравнение х3
+ q = рх имеет два положительных корня х1
и х2
, то уравнение y3
= ру + q– один положительный корень у1
= –х3
причем у1
= х1
+ х2
(это знал Кардано), x1
2
+ x2
2
+ x1
x2
= p, x1
x2
(x1
+ x2
) = q.
Как видим, в исследованиях Виета встречались начала теории симметрических функций и разложения многочленов на линейные множители, что вскоре привело к открытию основной теоремы алгебры о числе корней уравнения произвольной степени. Эти исследования Виета продолжили математики следующего поколения Т. Гарриот (1560— 1621), А.Жирар (1595-1632), Р. Декарт (1596-1650).
2.3 Символика Декарта и развитие алгебры.
В сочинении «Исчисление г. Декарта» неизвестный автор изложил арифметические основы математики Декарта. Они писал: «Эта новая арифметика состоит из букв a, b, c и т.д., а также из цифр 1, 2, 3 и т.д. Если цифры стоят перед буквами, например, 2а, 3b, 1/4с, то это означает, что величина а берется двойной, величина b – тройной, а от величины с берется четверть. Но если они находятся позади букв, например, а3
, b4
, c5
, то это означает, что величина а умножается сама на себя три раза, величина b– четыре раза, а величина с – пять раз». «Сложение производится с помощью такого знака +. Так, чтобы сложить а и b, я пишу а + b. Вычитание производится с помощью такого знака –. Так, чтобы вычесть а из b, я пишу b– a и т. д. Если в вычитаемом выражении есть несколько частей, то у них в нем изменяются лишь знаки. Так, если из d требуется вычесть а – b + с, то останется d – а + b– –с. Точно так же при вычитании а2
– b2
из с2
– d2
останется с2
– d2
– а2
+ b2
. Но если имеются присоединенные цифры и члены одинакового вида, то их следует подписывать друг под другом и производить их сложение и вычитание как в обыкновенной арифметике... Если требуется умножить одну букву на другую, то их следует лишь соединить вместе, но если имеются присоединенные, числа, то они следуют законам обыкновенной арифметики. Что касается знаков, то известно, что + на + дает в произведении + и что –, умноженный на –, также дает в произведении +. Но + на – или же –, умноженный на +, дает в произведении –».
Точно так же определялись действие деления, операции с дробями «по правилам обыкновенной арифметики». Вот рассуждение о корне: «Когда корень извлечь из квадрата нельзя, его квадрат помещают под связку , чтобы отметить, что его следует рассматривать как корень, и тогда его корень называют иррациональной величиной».
Из всего этого видно, как далеко зашла формализация алгебраических действий по сравнению с тем, что было у древних греков и у предшественников Декарта; видно также, что надобности в геометрической интерпретации алгебры уже нет.
Формализации алгебры (и всей математики) чрезвычайно способствовало то, что Декарт усовершенствовал буквенную символику. Он обозначал известные величины буквами а, b, с, . . ., неизвестные («неопределенные») – буквами x, y, z, .... Он ввел обозначения степеней: a2
, a3
, х3
, . . . Правда, квадраты величин он выражал и с помощью символов аа, хх. Обозначение корня несколько отличается от современного. Так, выражение означает один из кубических корней, входящих в формулу Кардано.
Все буквы в формулах Декарта считались положительными величинами; для обозначения отрицательных величин ставился знак минус; если знак коэффициента произволен, перед ним ставилось многоточие. Знак равенства имел необычный вид . Вот как, например, выглядело уравнение с произвольными коэффициентами:
+x4
…px3
…qx… 0.
И еще один символ применял Декарт: он ставил звездочки, чтобы показать отсутствующие члены уравнения, например:
x5
*** – b 0.
Другие математики того времени тоже пользовались символикой, близкой к разработанной Декартом, а древние греки излагали свои мысли вообще без символики. Ферма построил аналитическую геометрию, располагая запасом употребляемых до него алгебраических средств. «...все это может побудить нас недооценить те успехи, которые поставлены здесь во главу всей математической деятельности Декарта. Значение этих успехов становится, однако, понятным, если мы примем во внимание, как часто мы должны были для изложения идей более ранних авторов прибегать к пользованию алгебраической формой Декарта; без нее мы вряд ли смогли бы это сделать сколь-нибудь сжато и наглядно. Мы смогли воспользоваться этой алгебраической формой, с одной стороны, потому что декартова трактовка алгебры благодаря своим преимуществам получила ныне широкое распространение, и знакомство с ней происходит уже в школе. С другой стороны, она уже сама по себе в большой мере расчистила путь многому, что раньше могло быть изложено лишь весьма громоздким образом и было поэтому доступно лишь очень способным математикам» (Цейтен Г. Г, История математики в XVI и XVII веках, с. 202)
Иными словами, разработка и введение алгебраической символики сделали математику более демократичной.
Уравнения, по утверждению Декарта, представляют собой равные друг другу суммы известных и неизвестных членов или же, если рассматривать эти суммы вместе, равны «ничему» (нулю). Декарт указал, что «уравнения часто удобно рассматривать именно последним образом», т. е. в виде Р (х) = 0. Для теоретических построений Декарта такая запись уравнений играла важную роль.
Этой формой он пользовался при установлении числа корней алгебраического уравнения, что привело к формулировке основной теоремы алгебры: число корней уравнения (положительных - «истинных», отрицательных - «ложных» и мнимых - «воображаемых») равно числу единиц в наивысшем показателе степени входящей в уравнение неизвестной величины. Справедливость теоремы он аргументировал тем, что при перемножении n двучленов вида х – а получается многочлен степени n. Недостающие «воображаемые» корни, природу которых Декарт не разъясняет, можно примыслить.
Если все корни положительны, то, по словам Декарта, дело обстоит так: «Знайте, что всякое уравнение может иметь столько же различных корней или же значений неизвестной величины, сколько последняя имеет измерений; ибо если, например, принять х равным 2, или же х – 2 равным ничему, а также х = 3 или же х – 3 = 0, то, перемножив оба эти уравнения x – 2 = 0 и x – 3 = 0, мы получим хх – 5х + 6 = 0, или же хх = 5x – 6, уравнение, в котором величина х имеет значение 2 и вместе с тем значение 3.
Если принять еще, что х – 4 = 0 и умножить это выражение на хх – 5x + 6 = 0, то мы получим х3
– 9хх + 2бх – 24 = 0, другое уравнение, в котором х, обладая тремя измерениями, имеет вместе с тем три значения, а именно 2, 3 и 4»
Если же «х выражает собой также недостаток какой-нибудь величины, скажем 5, то мы получим х + 5 = 0». Умножив х + 5 на левую часть предыдущего уравнения и приравняв результат нулю, получим
x4
– 4x3
– 19xx + 10бх – 120 = 0, (1)
«уравнение, у которого четыре корня, именно три истинных 2, 3, 4 и один ложный –5».
Построение левой части уравнения в виде произведения двучленов приводит к тому, что степень уравнения можно понизить, разделив левую часть его на х – a, где а – корень уравнения. С другой стороны, если такое деление невозможно, то число а не будет корнем уравнения. Левую часть уравнения (1), например, можно разделить на х – 2, х – 3, х – 4, х + 5 и нельзя разделить на любой другой двучлен х – а; «это показывает, что оно может иметь лишь четыре корня: 2, 3, 4 и –5».
Декарт сформулировал правило знаков, дающее возможность установить число положительных и отрицательных корней уравнения: «Истинных корней может быть столько, сколько раз в нем изменяются знаки + и –, а ложных столько, сколько раз встречаются подряд два знака + или два знака –». Впоследствии он внес уточнение: при наличии мнимых («невозможных») корней уравнения число положительных корней может (а не должно) быть равным числу перемен знаков. Декарт высказал правила и на примерах показал, какие следует выполнять преобразования, чтобы изменить знаки корней уравнения, увеличить или уменьшить корни, получить уравнение, не содержащее второго члена, и т. д. «Легко, далее, сделать так, чтобы все корни одного и того же уравнения, бывшие ложными, стали истинными, и вместе с тем все бывшие истинными стали ложными; именно это можно сделать, изменив на обратные все знаки + или –, стоящие на втором, четвертом, шестом и других, обозначенных четными местах, не изменяя знаки первого, третьего, пятого и им подобных, обозначенных нечетными числами мест».
Применив такое преобразование к уравнению (1), получим уравнение
х4
+ 4x3
- 19хх – 106x - 120 = 0, (2)
имеющее один положительный корень 5 и три отрицательных: –2, –3, –4.
Можно, не зная корней уравнения, увеличить или уменьшить их на какую-либо величину, для чего необходимо сделать соответствующую замену. Например, уравнение (2) после замены х = у – 3 преобразуется к виду y3
– 8у2
– у + 8 == 0; его положительный корень 8 превышает положительный корень уравнения (2) на 3.
Декарт заметил, что, «увеличивая истинные корни, мы уменьшаем ложные и наоборот», при этом он имел в виду абсолютные величины корней.
Правило исключения второго члена уравнения, известное еще Виету, Декарт иллюстрировал примерами.
Так, уравнение y4
+ 16y3
+ 71y2
– 4y –120 = 0 подстановкой z – 4 = у он сводил к
z4
– 25z2
– 60z – 36 = 0; его корни –3, -2, -1, 6.
Второй член уравнения x4
- 2ах3
+ х2
(2а2
- с2
) - 2aз
x + а4
= 0 он исключал подстановкой х = z + aего к виду z4
+ z2
(a2
– c2
) – z (a3
+ ac2
) + a4
– a2
c2
= 0.
Декарт говорил, что можно также «сделать, чтобы все ложные корни уравнения стали истинными, но истинные не стали ложными». Он утверждал, что легко приблизительно оценить величину неизвестных отрицательных корней уравнения. В этом можно усмотреть постановку вопроса о границах действительных корней уравнения, которому впоследствии уделил большое внимание Ньютон.
Для умножения и деления неизвестных корней уравнения на число, приведения дробных и иррациональных коэффициентов к целым Декарт пользовался теми же подстановками, которые были известны и Виету. Рассмотрим пример.
Если положить у = х и z = 3у, то уравнение
x3
– x2
+ x – = 0
преобразуется последовательно в уравнение
y3
– 3y2
+ y – = 0, а затем в z3
– 9z2
+ 26z– 24 = 0.
Корни окончательного уравнения 2, 3, 4; предыдущего – , 1, ; первого – , , .
О «воображаемых» (мнимых) корнях уравнения Декарт писал: «Как истинные, так и ложные корни не всегда бывают действительными, оказываясь иногда лишь воображаемыми. Другими словами, хотя всегда можно вообразить себе у каждого уравнения столько корней, сколько я сказал, но иногда не существует ни одной величины, которая соответствует этим воображаемым корням. Так, например, хотя у уравнения х3
– 6xx + 13x–10 = 0 можно вообразить себе три корня, но на самом деле оно имеет только один действительный, именно 2. Что касается двух других корней, то сколько бы их ни увеличивать, уменьшать или умножать так, как я только что объяснил, все равно их не удастся сделать иными, чем воображаемыми».
Еще одна чрезвычайно важная задача алгебры была поставлена Декартом – задача приводимости уравнений, т. е. представления целого многочлена с рациональными (целыми) коэффициентами в виде произведения многочленов низших степеней. Декарт установил, что корни уравнения третьей степени с целыми коэффициентами и старшим коэффициентом, равным единице, строятся с помощью циркуля и линейки (иначе говоря, уравнение разрешимо в квадратных радикалах) тогда и только тогда, когда уравнение имеет целый корень (т. е. левая часть его может быть представлена в виде произведения множителей первой и второй степеней).
Для уравнения четвертой степени он также указал условие разрешимости; оно состоит в разрешимости его кубической резольвенты, т. е. соответствующего уравнения шестой степени, кубического относительно у2
.
Декарт не показал, как он получил окончательный результат. Ф. Схоотен вывел резольвенту с помощью метода неопределенных коэффициентов. Он представил многочлен четвертой степени в виде x4
– px2
– qx + r = (x2
+ yx + z)(x2
– yx +v), откуда получил уравнения для нахождения у, z, у: z – y2
+ v = –p, –zy+vy = –q, vz = r.
Разрешающее уравнение (резольвента) имеет вид у6
– 2ру4
+ (р2
– 4г)y2
– q2
= 0.
В конце третьей книги «Геометрии» Декарт графически решал уравнения третьей, четвертой, пятой и шестой степеней, отыскивая их корни как пересечение некоторых линий.
Вклад Декарта в математику не ограничивается одной «Геометрией»: в его переписке содержатся решения многих задач, в том числе связанных с бесконечно малыми.
§3 Обозначение производной и интеграла у Лейбница и развитие анализа.
Лейбниц внес большой вклад в развитие математического анализа. Ему принадлежит создание многих символов, которые мы используем сейчас, например, dx, ddx,…, d2
x, d3
x, , . Но символы эти появились у Лейбница не сразу. Первоначально выражение = хu
(1)
у него выглядело следующим образом: omn. xw = ult. х×omn. w – omn. omn. w. При этом он еще не употреблял привычного нам знака равенства.
В этом выражении omn. – начальные буквы латинского слова omnia, т. е. все, – обозначает объединение, суммирование «всех» бесконечно малых элементов, стоящих под этим знаком, х обозначает абсциссу точки на кривой, исходящей из начала координат, w в этих выкладках Лейбница обозначает то элемент дуги (ds), то дифференциал ординаты (dy), ult. – начальные буквы латинского слова ultima (т. е. последняя) – относится к абсциссе.
Для Лейбница в данном случае его omn.w выступает в роли новой функции, которая сама становится объектом операции, обозначенной omn. Как это обстоятельство, так и то, что он рассматривает результат многократного применения преобразования вида (1) и получает выражения, в которых операция omn. наслаивается несколько раз, заставило его искать более удобное обозначение, и в записи от 29 октября мы читаем: полезно писать вместо omn., так что будет вместо omn. (- это начальная буква слова summa и Лейбниц называет этот знак суммой). И для нового исчисления, как в той же записи выражается Лейбниц, имеем
, , =, .
Первое из этих соотношений соответствует преобразованию (1), а, b - постоянные, черта сверху играет роль скобки, и она, собственно, лишняя, да и Лейбниц не всегда ее пишет, но ее, пусть несистематическое, появление характерно: так, в записи х мы видим, что пишущему кажется необходимым дополнительно указать, что на х действительно умножаются все , собранные в сумму знаком . Лейбниц далее записывает (по поводу формул (2) и их вариантов): «Это достаточно ново и примечательно, поскольку указывает на новый вид исчисления», и переходит к обратному исчислению (contrariocalculo), вводя символ d, который «уменьшает измерение так, как увеличивает », но пишет его в знаменателе (не dy, ay/d).
Тут же читаем: обозначает сумму, d - разность. Несколькими днями позже, в рукописи, помеченной 10 ноября, Лейбниц записывает: «dx — то же самое, что x/d, то есть разность между двумя ближайшими».
Замечательно то, что Лейбниц сразу, введя новое обозначение, начинает с ним обращаться как с символом операции, отделяя его от объекта операций: он сразу отметил, что его «сумма» от (двух) слагаемых равна сумме «сумм» слагаемых и что постоянный множитель или делитель можно выносить за знак «суммы». В записях последующих дней (от 1, 10, 11 ноября) он отмечает такие же свойства операции, обозначенной через d. За эти дни Лейбниц убедился, что d(xy) не то же самое, что dx×dy, и что d(x/y) ¹dx/dy, но не вывел еще соответствующих формул. Отметил он и что , конечно, не то же самое, что . Он уже систематически использует обратность действий и d, например, после равенства он пишет: или wz = y2
/2d (тут d еще в знаменателе). Отмечены им уже формулы для производной степенной функции при целых показателях степени, например, «из квадратуры треугольника ясно, что y2
/2d = у; = из квадратуры параболы».
А в том, что он открывает здесь нечто весьма существенное, Лейбниц, вероятно, окончательно убедился, когда смог использовать пока как бы нащупываемый им алгоритм при решении задач на обратный метод касательных. Он писал: «Еще в прошлом году я поставил перед собой вопрос, который можно отнести к труднейшим во всей геометрии, поскольку распространенные до сих пор методы здесь почти ничего не дают. Сегодня я нашел его решение и я приведу его анализ».
Свою задачу Лейбниц формулирует как определение кривой, у которой поднормали обратно пропорциональны ординатам. Такая задача сводится, в современных обозначениях, к решению дифференциального уравнения ydy/dx = k/y, где k - постоянная. Решение Лейбница состоит по сути в составлении такого уравнения и последующем его интегрировании с помощью разделения переменных. Он получил, таким образом, уравнение искомой кривой, и она оказалась кубической параболой.
По записям Лейбница видно, что к середине 1676 г. он, располагая уже всеми основными правилами дифференцирования и интегрирования, решил еще несколько задач на обратный метод касательных, в том числе знаменитую в XVII в. задачу де Бона, предложенную в свое время Декарту, который не смог получить ее общее решение. И это результат вполне самостоятельного хода мыслей. То, что Лейбниц знал к тому времени относительно результатов Ньютона и Грегори, никак не могло помочь ему пройти избранный им путь. Операционный подход Лейбница к проблеме и его поиски рациональной символики для нового исчисления, в чем наиболее полно выразилась творческая индивидуальность Лейбница, были в достаточной мере чужды его английским соперникам.
Примерно через год после открытий 1675 г., во время поездки по Голландии и после встречи там с Гудде, Лейбниц составил заметку, озаглавленную «Дифференциальное исчисление касательных». Она начинается записями:
d = 1, d = 2x, d = Зх2
и т. д.
d= –, d = –, d= – и т. д.
d=и т. д.
Отсюда выводится общее правило для разностей и сумм простых степеней:
d= exe
-1
и, напротив, = (горизонтальная черта сверху означает взятие в скобки).
Как видно, здесь знак d обозначает операцию вычисления производной. Но Лейбниц еще не вполне выработал к тому времени свою символику и чуть ниже можно прочитать, что «общее правило устанавливается так: и, наоборот, ». Такая редакция общего правила следует за замечанием: «пусть у = x2
, тогда будет = 2x, следовательно, = 2x». И на полях, вероятно, позже, Лейбниц написал, что это отличное замечание к его исчислению разностей: «если by+ + etc. = 0, то b+ = 0, и так с остальными». Здесь он начинает свободно обращаться с дифференциалами, как это ему удобно при решении дифференциальных уравнений, не предопределяя, какое из переменных независимое, какое функция.
Дальше в том же наброске следует замечание, что вот, «возьмем какое-либо уравнение (но берется уравнение алгебраической кривой, притом второго порядка) ... и напишем у +dy вместо у и подобным образом x + dx вместо х, тогда, опустив то, что опустить надлежит, получим другое уравнение» (т. е. оставляются только слагаемые первого порядка относительно дифференциалов, и это показано на примере).
Отсюда вытекает правило, обнародованное Слюзом, продолжает Лейбниц, и это, конечно, верно. Тут же он добавляет, что «мы бесконечно расширим это правило: пусть букв будет сколько угодно и из них составлена формула, например, из трех букв...». И Лейбниц сопоставляет уравнение алгебраической поверхности опять-таки второго порядка и небезупречно составленное путем дифференцирования соотношение между дифференциалами, чтобы заявить без дополнительного обоснования: «Отсюда явствует, что по такому методу получаем касательные плоскости поверхностей, и не имеет значения при этом, существует ли еще иное соотношение между теми же буквами х, у, z, его ведь можно будет подставить позже».
Конечно, указание на то, как определить касательную плоскость к поверхности, следовало еще развить, что в рассматриваемом отрывке отсутствует, но мы видим здесь пример того, как Лейбниц постепенно, по разным поводам, возвращается к своему исчислению, расширяет область его применения, наряду с новыми результатами получает с его помощью известные старые.
В 1678 г. Чирнгаус заявил Лейбницу, что надо по возможности избегать новых обозначений, ибо это только затрудняет доступ к науке. Вот Виет заслуживает похвалы за то, что обходится буквенными обозначениями, не вводя новых чудовищных знаков. Лейбниц, возражая подчеркивал, что надо искать обозначения, которые кратко выражают сокровенную сущность предмета, облегчая путь к открытиям и значительно уменьшая затрату умственного труда. И таковы, продолжал Лейбниц, использованные мною знаки – я часто с их помощью в несколько строк решаю самые трудные задачи.
В 1684 г. в «Лейпцигских ученых заметках» появилась одна из самых знаменитых математических работ: «Новый метод максимумов и минимумов, а также касательных, для которого не являются препятствием ни дробные, ни иррациональные величины, и особый для этого род исчисления». В этой небольшой статье даны основы дифференциального исчисления. Правила дифференцирования приводятся без доказательств, хотя есть указания на то, что здесь все можно обосновать, рассматривая дифференциалы как бесконечно малые разности. Определение дифференциала функции дано как произведение производной (но производная задается геометрически как отношение ординаты к подкасательной) на дифференциал аргумента. Последний можно задавать произвольно. Еще не вводится определенное соглашение относительно выбора знака для длин отрезков, которыми оперирует Лейбниц, поэтому он привод некоторые формулы с двумя знаками. В статье были опечатки, затруднявшие чтение, были и ошибочные утверждения (относительно определения точек перегиба). Но в ней были и эффективные примеры применения нового алгоритма, и автор, приведя их, имел право заявить: «Во всех таких и много более сложных случаях наш метод обладает одной и той же поразительной и прямо беспримерной легкостью. Но это лишь начала некой более высокой Геометрии, которая распространяется на труднейшие и прекраснейшие задачи прикладной математики, и едва ли кому-нибудь удастся заняться с той же легкостью такими вещами, не пользуясь нашим дифференциальным исчислением или ему подобным».
Год 1690-й отмечает новый этап: начинается переписка и многолетнее научное общение Лейбница с Яковом Бернулли, а затем и его младшим братом Иоганном, напечатана первая работа по анализу старшего из братьев, и оба они, математики первого ранга, отныне все усилия приложат для развития нового исчисления.
Через посредство И. Бернулли с новым исчислением знакомится и становится его приверженцем самый значительный французский механик тех лет П. Вариньон.
На Лейбница появление приверженцев его метода и умножение примеров, показывающих плодотворность созданного им исчисления, действовало стимулирующе.
Новые результаты Лейбница достаточно разнообразны. Некоторые из них относятся к технике дифференцирования. Так, в «Новом методе...» 1684 г. дифференцируются только алгебраические функции, рациональные и иррациональные, и, в неявном виде, логарифм, а в 90-е годы Лейбниц, можно сказать, мимоходом в различных работах указывает дифференциалы синуса и арксинуса, функции вида uv
, где основание и показатель степени — функции независимого переменного, вводит дифференцирование по параметру. Позже Лейбниц дает носящую его имя формулу для дифференциала любого порядка от произведения функций. Можно сказать, что на этой стадии операция дифференцирования у Лейбница охватила весь запас известных тогда функций.
Другая группа результатов Лейбница относится к дифференциальной геометрии. Один из наиболее существенных – введение огибающей семейства плоских кривых, зависящих от некоторого параметра.
В третью группу можно объединить результаты по интегральному исчислению. Кроме формул, представляющих собой обращение упомянутых формул дифференцирования, Лейбниц дал две работы об интегрировании рациональных дробей (1701 и 1703 гг.). В первой из них он допустил ошибку, сделав вывод, что при наличии комплексных корней у знаменателя рациональной дроби с действительными коэффициентами интегрирование должно ввести новые трансцендентные функции, кроме обратных круговых и логарифмов. Когда же И. Бернулли указал правильный результат, Лейбниц с ним не согласился и повторил свое ошибочное заключение во второй работе. Эта ошибка Лейбница – не только математический недосмотр, она имеет любопытные корни. Утверждение, что интегралы вида
,
дают новые трансцендентные функции казалось ему и привлекательным и правдоподобным еще потому, что это соответствовало лейбницевой метафизике. Если бы все интегралы такого вида сводились, как выражается Лейбниц, только к квадратуре гиперболы (т. е. логарифмам) и к квадратуре круга (к обратным круговым функциям), то все было бы единообразно. «Но природа, мать вечного разнообразия, или, лучше сказать, божественный дух слишком цепко оберегает свою прекрасную многоликость, чтобы допустить слияние всего в одну породу. И таким образом он находит изящный и удивительный выход в этом чуде анализа, этом побочном порождении мира идей, двойственном существе как бы между бытием и небытием, что мы называем мнимым корнем. И посему всякий раз, когда знаменатель рациональной дроби имеет мнимые корни, что может получиться бесконечно многими способами, будет мнимой и гипербола, квадратура которой нам нужна, и ее никоим образом нельзя будет построить».
От Лейбница не ускользнуло и то, что интеграл можно рассматривать как дифференциал с показателем –1, и это привело его к введению дифференциалов любых отрицательных и дробных порядков с помощью бесконечных рядов. Теорию интегралов и производных дробного порядка развивали в XVIII в. Эйлер, в XIX в. – Лиувилъ, Риман, Летников, в XX в. – Г. Вейль, М. Рис и др., и сейчас она составляет один из разделов анализа. Лейбниц же первый в печати указал на то, что операция интегрирования вводит произвольную постоянную и на связь между определением первообразной функции и квадратурой. Он указал также, как интегрировать некоторые типы обыкновенных дифференциальных уравнений. Существенно то, что Лейбниц отчетливо определил взаимоотношение интегрирования дифференциальных уравнений и интегрирования функций (первое следует считать выполненным, если оно сведено ко второму), и, аналогично, интегрирования функций и алгебраических операций (например, определение корней знаменателя подынтегральной рациональной дроби считается при интегрировании задачей решенной).
Лейбниц много занимался также интегрированием иррациональностей (в конечном виде, как стали позже выражаться) и глубоко проник в суть этой проблемы.
Заслугой Лейбница является и применение к интегрированию и функций и дифференциальных уравнений бесконечных рядов с использованием метода неопределенных коэффициентов (последний метод восходит к Декарту). Немалое значение для успехов нового анализа имело достаточно общее введение такого понятия, как функция, и систематические выступления Лейбница против ограничения (по Декарту) предмета геометрии изучением алгебраических кривых. Наконец, Лейбниц на деле доказал достоинства своего исчисления, с успехом участвуя в конкурсах на решение таких трудных для того времени задач, как задача Галилея о цепной линии и задача И. Бернулли о брахистрохроне.
Историческое значение математического творчества Лейбница огромно. Оно длилось около сорока лет, и за такой сравнительно небольшой срок математика преобразилась. Наука, в которую вступил Лейбниц, и наука, которую он оставил, принадлежит разным эпохам, и это плод главным образом его трудов и трудов его школы. До Лейбница в обширную область неведомого пытались проникнуть то тут, то там, наскоками, пусть порою очень удачными, не имея общего плана. Благодаря Лейбницу разрозненные прежде усилия были подчинены общей программе, прояснились и близкие и далекие цели, средства для их достижения оказались в распоряжении не только сверходаренных одиночек и значительно выиграли в эффективности.
§ 4. Язык кванторов и основания математической логики.
В связи с тем, что элементы логики представляют собой неотъемлемую составную часть школьного обучения математике, они должны изучаться в единстве с собственно математическим материалом на всех этапах обучения. Соответствующий язык необходимо вводить постепенно для обозначения уже разъясненных математических и логических понятий, чтобы в дальнейшем он становился необходимым компонентом обиходного математического языка.
4.1 Алгебра высказываний.
Эта тема важна для школьной математики. Не овладев ее основными действиями, нельзя понять последующие темы, как, не овладев таблицами сложения и умножения, нельзя научиться арифметике и тем более алгебре.
Исходные объекты алгебры высказываний – это простые высказывания. Их будем обозначать строчными латинскими буквами a, b, c, …, x, y, z. Предполагается, что всякое простое высказывание обладает одним и только одним из двух свойств: либо оно истинно, либо ложно.
Будем пользоваться почти повсеместно принятой терминологией: свойства истинности (и) и ложности (л) мы будем называть значениями истинности высказываний. При такой терминологии значение истинности сложного высказывания есть функция от значений истинности простых высказываний; такая функция называется логической связкой.
4.1.1 Определения основных логических связок
а) Отрицание (знак ù ). Если а – высказывание, то ùа (читается: «не а») также высказывание; оно истинно или ложно в зависимости от того, ложно или истинно высказывание а.
Таким образом, операция отрицания описывается следующей таблицей:
Мы видим, что операция ù в теории высказываний вполне соответствует понятию отрицания в обыденном смысле слова. Если, например, а – высказывание «Число три делит число шесть», то отрицанием ùа этого высказывания будет «Число три не делит число шесть». Высказывание а при этом истинно, высказывание ùа, – ложно.
Если же в качестве высказывания а взять какое-нибудь ложное высказывание, например «Число три делит число пять», то его отрицание ùа будет высказывание «Число три не делит число пять» - истинное высказывание.
б) Конъюнкция. В качестве знака для конъюнкции мы будем употреблять знак Ù (можно также &).
Если а и b - высказывания, то а Ùb (читается: «а и b») – новое высказывание; оно истинно тогда и только тогда, когда а истинно и b истинно.
В отличие от операции отрицания, зависящей от одного элементарного высказывания, конъюнкция, как и все последующие приводимые нами связки, зависит от двух элементарных высказываний, поэтому они называются двуместными связками, отрицание же - связка одноместная.
Для задания двуместных связок удобно записывать матрицы истинности в виде таблиц с двумя входами: строки соответствуют значениям истинности одного элементарного высказывания, столбцы – значениям другого элементарного высказывания, а в клетке пересечения столбца и строки помещается значение истинности соответствующего сложного высказывания.
Значение истинности сложного высказывания а Ùb задается матрицей
Как видно, определение операции конъюнкции вполне соответствует обыденному значению союза «и»:
в) Дизъюнкция. В качестве знака для дизъюнкции мы будем употреблять знак Ú.
Если а и b – высказывания, то а Úb (читается: «а или b») – новое высказывание, оно ложное, если а и b ложны; во всех остальных случаях а Úb истинно.
Таким образом, матрица истинности для операции дизъюнкции выглядит так:
Операция дизъюнкции довольно хорошо соответствует обыденному значению союза «или».
Примеры.
«Три делит пять или три больше шести» ложно;
«Три делит шесть или три больше шести» истинно;
«Три делит шесть или три меньше шести» истинно.
г) Импликация. В качестве знака для импликации будем употреблять знак Þ.
Если а и b – два высказывания, то а Þb (читается: «а имплицирует b») – новое высказывание; оно всегда истинно, кроме того случая, когда а истинно, а b ложно.
Матрица истинности операции импликации следующая:
В импликации а Þb первый член а называется антецедентом, второй b – консеквентом.
Операция Þ описывает в некоторой мере то, что в обыденной речи выражается словами «Если а, то b», «Из а следует b», «а – достаточное условие для b», но на этой аналогии не следует слишком настаивать. Действительно, учитывая определение импликации, данное выше, и интерпретируя выражение а Þb как «если а, то b», мы получаем: «Если дважды два – четыре, то трижды три – девять» – истинное высказывание; «Если дважды два – пять, то трижды три – восемь» – истинное высказывание и только высказывание типа «Если дважды два – четыре, то трижды три – восемь» ложно.
По определению импликации сложное высказывание а Þ всегда истинно, если консеквент истинный или если антецедент ложный, что в очень малой мере отражает обыденное значение выражения «Если а, то b» или «Из а следует b». Ни в какой мере не следует рассматривать высказывание импликации как означающее, что антецедент является причиной, а консеквент — следствием в том смысле, как это понижается в естественных науках.
Несколько позже мы убедимся, что операция импликации достаточно точно выражает понятие логического следования в той форме, как оно употребляется в математике.
д) Эквиваленция. Для этой операции мы будем употреблять знак Û. Операция эквиваленции определяется так: если а и b – два высказывания, то а Ûb (читается: «а эквивалентно b»; Û соответствует словесному выражению «...тогда и только тогда, когда...») – новое высказывание, которое истинно, если либо оба высказывания истинны, либо оба – ложны.
Из этого определения связки Û следует, что ее матрица истинности выглядит так:
Введенными пятью связками (ù, Ù, Ú, Þ, Û) мы ограничимся.
С помощью уже введенных связок мы можем строить сложные высказывания, зависящие не только от двух, но и от любого числа элементарных высказываний.
Отметим в этой связи, что так называемое нестрогое неравенство а £b (читается: a меньше или равно b») представляет собой дизъюнкцию (а < b) Ú (a = b); оно истинно, если истинно по меньшей мере одно из входящих в него простых высказываний. Хорошими примерами сложных высказываний, встречающихся в школьной практике, являются так называемые двойные неравенства. Так, формула а < b < с означает (а < b) Ù (b < с), а, например, а < b£c означает сложное высказывание (а < b) Ù ((b < c) Ú (b = c)).
Построение сложных высказываний делается аналогично тому, как в элементарной алгебре с помощью операций сложения, вычитания, умножения и деления строятся сколь угодно сложные рациональные выражения. А именно, предположим, что мы уже построили два каких-нибудь сложных высказывания, которые мы ради удобства сокращенно обозначим большими латинскими буквами А и В (при этом мы условимся, что элементарные высказывания следует рассматривать как частный случай сложных). Тогда новые высказывания можно получить, соединив А и В одним из знаков Ù, Ú, Þ, Û или же построив высказывание ùА и заключив результат в скобки. Сложными высказываниями будут, например, высказывания следующего вида:
((а Þb) Ù (с Ú а)); ((а Þb) Û (с Þùа)).
При этом предполагается, что встречающиеся здесь буквы являются сокращенными обозначениями каких-либо высказываний.
Таким образом, в принципе зная эти высказывания, можно было бы построить русские фразы, выражающие эти сложные высказывания. Только словесное описание сложных высказываний быстро становится малообозримым, и именно введение целесообразной символики позволяет проводить более глубокое и точное исследование логических связей между различными высказываниями.
Располагая значением истинности простых высказываний, легко подсчитать на основании определения связок значение истинности сложного высказывания. Пусть, например, дано сложное высказывание
((bÚ с) Û (bÙa))
и пусть входящие в него элементарные высказывания имеют следующие значения истинности: а = л, b = и, с = и. Тогда bÚ с = и, bÙa = л, так что (( bÚ с) Û (bÙ а)), т. е. рассматриваемое высказывание ложно.
4.1.2 Высказывания и булевы функции
Одной из основных задач алгебры высказываний является установление значения истинности сложных высказываний в зависимости от значения истинности входящих в них простых высказываний. Для этого целесообразно рассматривать сложные высказывания как функции входящих в них простых высказываний. С другой стороны, так как значение истинности (и или л) сложного высказывания зависит по определению логических связок не от самих простых высказываний, а лишь от их значения истинности, то можно считать, что любое сложное высказывание определяет функцию, аргументы которой независимо друг от друга принимают значения и или л, а значение самой функции также принадлежит множеству {и, л} (конечно, существенно не то, что речь идет о функциях от нескольких аргументов из множества {и, л} в множество {и, л}, а лишь то, что данные множества двухэлементны. Эти множества зачастую обозначают не через {и, л}, а, например, через {0, 1}, считая, что 1 означает «истину», а 0 – «ложь»).
Такие функции называются булевыми функциями (по имени Д. Буля). Например, формула F (а, b, с) = (а Ùb) Þ (с Ù а) описывает, учитывая определение входящих в нее связок, булеву функцию, задаваемую следующей таблицей:
а |
b |
с |
F(a, b, с) |
а |
b |
с |
F(a, b, с) |
и |
и |
и |
и |
л |
и |
и |
и |
и |
и |
л |
л |
л |
и |
л |
и |
и |
л |
и |
и |
л |
л |
и |
и |
и |
л |
л |
и |
л |
л |
л |
и |
Заметим, что булевых функций от n аргументов имеется лишь конечное число, а именно столько, сколько возможно функциональных таблиц. Число возможных наборов аргументов равно 2n
, а каждому набору аргументов можно независимо друг от друга сопоставлять одно из значений и или л. Таким образом, число всевозможных булевых функций от n аргументов равно – Оно очень быстро растет с ростом n. Изучение свойств булевых функций имеет большее значение как для алгебры и математической логики, так и для их приложений в кибернетике и теории автоматов. Естественно распространить определение высказывательных связок, так как мы их определили выше, на булевы функции. Мы ограничимся рассмотрением лишь связок Ù, Ú, ù называемых булевыми связками (или булевыми операциями). Такое ограничение оправдано тем, что, как легко проверить, связки Þ и Û могут быть выражены через другие булевы связки. При помощи таблиц истинности, приведенных выше, легко проверяются следующие тождества:
a Þ b º (ù a) Ú b;
a Û b º (a Ù b) Ú (ù a Ùùb),
которые позволяют повсеместно заменить связки Þ, Û на Ù, Ú, ù.
Если мы теперь имеем булевы функции {F (xl
, х2
, ..., хn
), G (х1
, х2
, ..., хn
)} от n переменных, то действие связок над ними определяется естественным образом:
F (xl
, x2
, ..., хn
) ÙG (х1
, x2
, ..., хn
), F (xl
, x2
, ...,хn
) ÚG (xl
, x2
, ..., хn
), ùF (xl
, x2
, ..., хn
) – это такие булевы функции, которые принимают значения, предписываемые соответствующими таблицами для каждого возможного значения аргументов. Кратко: булевы операции так переносятся на булевы функции, как действия арифметики переносятся на обычные функции числовых аргументов. Вообще имеет место далеко идущая аналогия между обычной алгеброй чисел и числовыми функциями, с одной стороны, и высказываниями и булевыми функциями – с другой. При этом можно отметить, что в одном определенном смысле алгебра булевых функций проще алгебры числовых функций: если рассматривать лишь функции некоторого конечного числа аргументов, то таких функций лишь конечное число. Поэтому выкладки с булевыми функциями вполне доступны пониманию школьников старших классов.
Естественно, закономерности булевой алгебры менее привычны и вызывают удивление и недоверие: это судьба всякого новшества.
Выпишем законы булевой алгебры. Большими латинскими буквами А, В, ..., X, Y, Z мы обозначим объекты, над которыми осуществляются булевы операции Ù, Ú, ù. Для определенности будем считать, что эти объекты – булевы функции некоторого фиксированного числа переменных. Среди них есть два особых элемента: 1, 0. Это соответственно функции, принимающие для всех аргументов значения 0 и 1 (постоянные функции – нуль и единица). Тогда
А Ù В = В Ù А, AÚB = BÚA
AÙ (В ÙC) = (А Ù В) ÙCAÚ (В ÚC) = (А Ú В) ÚC
A Ù A = A A Ú A = A
A Ù 1 = A A Ú 1 = A
A Ù 0 = 0 A Ú 0 = A
ù(A Ù B) = ùA ÚùB ù(A Ú B) = ùA ÙùB
A Ù (B Ú C) = (A Ù B) Ú (A Ù C) A Ú (B Ù C) = (A Ú B) Ù (A Ú C)
ùùA = A
Если, как это обычно делают, булевы операции Ú, Ù, ù считать аналогом сложения, умножения и перехода к противоположному числу, то некоторые из вышеприведенных законов те же, что для числового сложения и умножения, другие же существенно отличаются от привычных.
4.1.3 Задания для учащихся.
Верно ли высказывание: ù(205 кратно 5); 77; ù(8>10); 1£3£3.
А – множество точек треугольника и В – множество точек четырехугольника.
Верноливысказывание: CÎA Ù CÎB; KÎB Ù KÎA; SÎB Ú SÎA; ù(SÎA)ÙSÎB?
Известно, что А=и, В=и, Х=л, Y=л. Найдите значение высказывания:
АÚùХ; ùYÙùA; AÞX; ù(ùВÚY); (AÙB)ÚX; (XÚB)ÞY; (XÙA)Þ(YÚB); ù (AÚX)Ù(YÚùX).
Составьте таблицу истинности высказываний: ùХÙХ; (ХÚY)ÚùY; (XÙY)ÚùX; ùXÞY; (XÙY)ÞY.
Используя переменные X, Y, Z, запишите сочетательное свойство операции «и».
Проверьте равенство (XÚY)ÙZº (XÙZ)Ú(YÙZ) и (XÙY)ÚZº(XÚZ)Ù(YÚZ), составляя таблицы истинности для левой и правой части.
4.2 Предикаты и кванторы.
4.2.1 Предикаты.
Алгебра предикатов – тот раздел математической логики, который непосредственно надстраивается над алгеброй высказываний.
Как мы видели, одной из основных задач алгебры высказываний является изучение истинности или ложности высказываний в зависимости от истинности или ложности входящих в них высказываний. Несмотря на большую важность этой области логики, она оказывается слишком бедной для описания и для изучения даже простейших заключений науки и практики. В рамки алгебры высказываний не укладываются ни простейшие заключения арифметики и геометрии, не говоря уже о довольно сложных логических выводах, с которыми мы сталкиваемся в других науках и в повседневной жизни.
Действительно, рассмотрим следующие простейшие заключения.
Из истинных высказываний «3 меньше 5» и «5 меньше 7» мы заключаем, что «3 меньше 7». Из истинных высказываний «Все птицы – животные» и «Все воробьи – птицы» мы делаем заключение: «Все воробьи – животные». Из высказываний «Петр – сын Ивана» и «Павел – сын Петра» мы заключаем: «Павел – внук Ивана» и т. д.
Заметим, что во всех рассмотренных примерах истинность заключения зависит не только от истинности посылок, но и от их содержания. Если изменить вид посылок, то может оказаться, что заключение будет неверным. Так (в первом примере) из истинных высказываний «3 меньше 5» и «5 не равно 7» нельзя делать заключение (которое оказывается истинным), что «3 меньше 7», или, изменив немного второй пример, из истинных высказываний «Все птицы – животные» и «Никакие рыбы не птицы» нельзя выводить ни ложное высказывание «Никакие рыбы не животные», ни истинное высказывание «Все рыбы – животные». Наконец, видоизменив последний пример, из истинных высказываний «Петр – сын Ивана» и «Павел – родственник Петра» мы не имеем права делать заключение (которое в действительности может быть как истинным, так и ложным), что «Павел – внук Ивана» (но можем вывести истинное заключение: «Павел – родственник Ивана»).
Чтобы построить систему правил, позволяющую логически выводить правильные заключения, учитывающие в какой-то мере содержание посылок, мы должны проанализировать строение простых высказываний. И здесь нам опять кое-что может подсказать грамматика. Следуя по такому пути, мы придем к разделу логики, называемому алгеброй предикатов. Она предполагает алгебру высказываний уже известной, но идет дальше: простые высказывания, из которых состоят сложные, в свою очередь расчленяются.
Теория предикатов исходит из следующей установки. Простые высказывания выражают, что некоторые объекты обладают некоторыми свойствами или находятся между собой в некоторых отношениях.
При этом понятия «свойство» и «отношение» рассматриваются как частные случаи общего понятия «предиката». Объекты, о которых говорится в высказываниях, называются «термами». Постараемся выяснить смысл этих понятий на примерах.
Рассмотрим сначала некоторое число простых предложений – высказываний, выражающих, что некоторый объект обладает некоторым свойством:
«Сократ – грек»;
«Платон – ученик Сократа»;
«Три – простое число»;
«Василий – студент» и т. д. ,
Все приведенные примеры – простые предложения, С точки зрения грамматики они состоят из подлежащего («Сократ», «Платон», «три», «Москва», «Василий») и сказуемого («есть грек», «есть ученик Сократа», «есть простое число»). Подлежащее является наименованием некоторого объекта – конкретного или абстрактного, сказуемое выражает некоторое свойство. В латинской грамматике сказуемое называется предикатом, и этим термином принято теперь пользоваться в математической логике в рассматриваемых ситуациях. Основным для алгебры предикатов является второй член предложения – сказуемое-свойство. Как же алгебра предикатов трактует понятие «свойство»? Она рассматривает его как некоторую функцию следующим образом.
Возьмем первый пример: «Сократ есть грек».
Вместо человека Сократ мы можем подставить имена всевозможных людей и будем получать всегда осмысленные предложения. Одни предложения будут истинными, другие – ложными:
«Сократ есть грек» – истинно;
«Платон есть грек» – истинно;
«Наполеон есть грек» – ложно;
«Ньютон есть грек» – ложно и т. д.
Более обще можно рассматривать выражение вида «X есть грек», где буква X указывает место, на которое нужно подставить имя некоторого человека, чтобы получить высказывание — истинное или ложное. Но, как нам уже известно, существенным свойством высказывания является его значение истинности и или л. Становясь на эту точку зрения, логика предикатов считает выражение «X есть грек» функцией, аргумент которой X пробегает класс всех людей, а сама функция принимает в качестве значений и или л. Если мы будем, как это принято в математике, «X есть грек» записывать сокращенно, например в виде Гр (X), то для значения X = Сократ получим Гр (Сократ) – и, а скажем Гр (Наполеон) – л и т. д. Относительно других приведенных примеров можно дословно повторить все то, что было сказано относительно первого.
Таким образом, предикатом или, лучше, предикатом-свойством будем считать функцию, определенную на некотором универсальном множестве и принимающую значения и и л. Те элементы, для которых значение предиката «истинно», обладают данным свойством, остальные не обладают.
Отсюда сразу видно, что в действительности всякий предикат-свойство вполне определяется подмножеством тех объектов, на которых данная функция принимает значение «истинно». Полезно привести примеры предикатов-свойств из области арифметики. Такими будут, например, свойства натуральных чисел «быть простым числом», «быть четным числом», «быть квадратом» и т. д.
Остановимся на примере «три есть простое число» и на соответствующем предикате-свойстве «быть простым числом». Введем для этого свойства сокращенное обозначение Пр (X). Предикат Пр (X) определен на множестве натуральных чисел. Имеем Пр(1) = л (поскольку 1 не принято рассматривать как простое число). Пр (2) = и, Пр (3) = и, Пр (4) = л, ..., Пр (10) = л, Пр (11) = и и т. д.
Подобно приведенным предикатам-свойствам, математическая логика рассматривает более общее понятие предиката-отношения. В зависимости от того, между каким числом объектов устанавливается отношение, мы различаем двухместные (бинарные), трехместные (тернарные) и т. д., в общем случае – n-местные отношения. Рассмотренные выше предикаты-свойства считаются унарными предикатами. Наконец, оказывается удобным в понятие предиката-отношения как частный случай включить и высказывания в качестве «0 – местных предикатов».
Все математические дисциплины имеют дело с предикатами-отношениями, причем самыми распространенными являются бинарные отношения. Они описываются, различными словами: «равны», «не равны», «больше», «меньше», «делить», «перпендикулярны», «параллельны» и т. д.
По аналогии с предикатом-свойством двухместным предикатом считается опять функция, на этот раз от двух аргументов, определенных на некотором универсальном множестве, принимающая значение и (истинно) и л (ложно): те пары элементов, для которых функция принимает значение и, находятся в рассматриваемом отношении, остальные пары в этом отношении не находятся.
Рассмотрим пример бинарного отношения, определенного на множестве натуральных чисел, а именно отношение, описываемое словом «больше». Если рассматривать это отношение как функцию от двух переменных X и Y (на множестве натуральных чисел), принимающую значения и или л в зависимости от того, будет ли соответствующее отношение выполняться или нет, то эта функция определяет предикат, который обозначим через > (X, Y). Тогда имеем, например, > (3, 2) = и, > (1, 3) = л, > (7, 5) = и и т. д. Более полно и обозримо двухместный предикаты >(Х, Y).
1 |
2 |
3 |
4 |
5 |
… |
1 |
л |
и |
и |
и |
и |
… |
2 |
л |
л |
и |
и |
и |
… |
3 |
л |
л |
л |
и |
и |
… |
4 |
л |
л |
л |
л |
и |
… |
5 |
л |
л |
л |
л |
л |
… |
… |
… |
… |
… |
… |
… |
… |
Конечно, совсем нетрудно указать в элементарной математике примеры трехместных предикатов и предикатов от еще большего числа аргументов. Так, трехместным предикатом является в геометрии отношение, описываемое словом «между»: «Точка Y лежит между точками Xи Z». В арифметике хорошо известны понятия наибольшего общего делителя и наименьшего общего кратного двух целых чисел: фраза «Число d является наибольшим общим делителем чисел а и b» описывает трехместный предикат. Трехместные предикаты на множестве действительных чисел задают действия сложения, вычитания, умножения и деления: X + Y = Z, X – У = Z, X • Y = Z, X : Y = Z. Примером четырехместного предиката может служить отношение между членами пропорции X : Y = Z : W
Ознакомившись с понятием предиката, мы переходим теперь к рассмотрению операций, позволяющих из некоторых исходных предикатов строить новые. Начнем изучение с простейшего случая одноместных предикатов. Пусть Р (X) и Q (X) – два одноместных предиката, определенных на некотором множестве М. С помощью операций алгебры высказываний мы можем строить новые предикаты на множестве М. Конъюнкция Р (X)ÙQ (X) – это предикат R1
(X) = Р(X)ÙQ(X), который истинен для тех объектов а из М, для которых оба предиката Р(X) и Q(X) истинны. Аналогично определяется дизъюнкция Р(X)ÚQ(X):R2
(X) = Р(X)ÚQ(X) – это предикат на М, который истинен в точности для тех аМ, для которых истинен по меньшей мере один из предикатов Р (X) и Q (X). Так же определяется отрицание ùР (X): R3
(X) = ùР(X) – предикат на М, истинный для тех и только тех а Î М, для которых Р (X) ложен.
4.2.2 Кванторы.
В алгебре предикатов наряду с операциями логики высказываний важнейшую роль играют операции, называемые кванторами. Именно употребление кванторов делает алгебру предикатов значительно более богатой, чем алгебру высказываний. Кванторы соответствуют по смыслу тому, что на обычном языке выражается словами «все» («для каждого», «для всех» и т. п.) и «существует» («некоторый», «найдется» и т. п.).
Понятие, обозначаемое словом «все», лежит в основе квантора всеобщности (или квантора общности). Если через Гр (X) обозначен предикат «X есть грек», определенный на множестве М всех людей, то из этого предиката с помощью слова «все» мы можем построить высказывание «Все люди – греки» (конечно, ложное высказывание). Это пример применения квантора всеобщности.
Вообще же квантор всеобщности определяется так. Пусть Р (X) – какой-нибудь предикат. Тогда квантор всеобщности – это операция, которая сопоставляет Р (X) высказывание
«Все X обладают свойством Р (X)». (*)
Для этой операции («все») употребляется знак (перевернутая латинская буква А, напоминающая о немецком слове «alle» или английском «all» – все). Высказывание (*) записывается так: (X)P(X) (читается: «для всех X Р от X»). В соответствии со смыслом слова «все» (X)Р(X) – ложное высказывание, кроме того единственного случая, когда Р (X) тождественно-истинный предикат.
Наряду с квантором всеобщности в логике предикатов рассматривается другой квантор – «двойственный» ему квантор существования, обозначаемый знаком (это перевернутая латинская буква E, напоминающая немецкое слово «existieren» или английское «exist» — существовать):
(Х)Р(Х)
(читается: «существует такое X, что Р от X») – высказывание, которое истинно тогда и только тогда, когда Р истинно по меньшей мере для одного объекта а из области определения М. Тем самым (X)Р(X) – истинное высказывание для всех предикатов Р (X), кроме одного – тождественно-ложного.
Между кванторами и имеют место отношения равносильности, позволяющие сводить любой из этих кванторов к другому: ù(X) P(X) Û(X) ùP(X) («Неверно, что все Xобладают свойством Р (X)» равносильно тому, что «Существует такой объект X, для которого истинно не Р (X)»). Отсюда имеем: (X) Ûù(X)ùP(X). Аналогично, имеет место двойственный закон: ù (X) P(X) Û(X)ùP(X). («Неверно, что существует X, обладающее свойством Р (X)» равносильно «Все X обладают свойством не Р (X)»).
Отсюда (X)Р(X)Ûù(X)ùP(X). Эти равносильности называют правилами де Моргана для кванторов.
С помощью квантора существования легко выражается суждение типа «Некоторые Р суть Q» (например, «Некоторые англичане курят», «Некоторые нечетные числа – простые» и т. п.), т. е. что по крайней мере один объект а, обладающий свойством Р, обладает также свойством Q. Этот факт записывается формулой (X)(Р(X)ÙQ(X)) («Существует такой X, что Р от X и Q от X»).
Аналогично с помощью кванторов записывается ряд других отношений между одноместными предикатами.
Гораздо более богатые возможности открывает применение кванторов к многоместным предикатам. Остановимся вкратце на этом вопросе.
Пусть А (X, Y) – некоторый двухместный предикат, определенный на некотором множестве М. Квантор всеобщности и квантор существования можно применять к нему как для переменной X, так и для переменной Y: (X)А(X, У); (Y)А(X, Y); (X)А(Х,Y); (Y)A(X,Y). Переменная, к которой применен квантор, называется связанной, другая переменная – свободной. Все четыре приведенных выражения являются записями одноместных предикатов от соответствующей свободной переменной. (X)А(X,Y) (читается: «для всех X, A от X и Y») – одноместный предикат от переменной Y: (X)А (X,Y)=F(У), Он истинен в точности для тех bÎМ, для которых одноместный предикат А (X, b) истинен для всех X. Если представить предикат А (X, Y) его таблицей, то предикат F (Y) = (X) (X, Y) истинен для тех b, для которых столбец с входом b содержит исключительно букву и.
Применение квантора к одной из переменных двухместного предиката превращает его в одноместный. В случае трехместных предикатов применение квантора приводит к двухместному предикату. Аналогично и для предикатов с большим числом мест применение квантора превращает n-местный предикат в (n – 1)-местный.
К свободной переменной X одноместного предиката (У)А(X, Y) в свою очередь можно применять квантор всеобщности или квантор существования. Получаются выражения
(X)((У)А(X,У)); (X)((Y)А(X,У)), которые, опуская скобки, принято записывать несколько проще: (X)(У)А(X,У); (X)(Y)А(X,У),
Это – высказывания. Первое истинно, если все строки, а тем самым и вся таблица предикатов, содержат только букву и, второе истинно, если соответствующая матрица содержит по меньшей мере одну тождественно-истинную строку. Три другие предиката (X)А (X,У), (У)А(X, У) и (X)А (X,У) также допускают квантификацию, так что в общей сложности мы получаем из одного предиката восемь формально различных высказываний: (X)(У)А (X, У); (X)(У)А (X,У); (X)(У)А (X, У); (X)(У)А (X, У); (У)(X) А (X, У); (У)(X)А(X, У); (У)(X)А (X, У); (Y) (X) А (X, У).
Нетрудно убедиться в том, что четыре высказывания, содержащие одинаковые кванторы, попарно эквивалентны:
(X)(У)А(X,У) Û(У)(X)А (X, У);
(X)(У)А (X, У) Û(Y)(X)А (X, У).
(X)(У)А(X,У) так же как и (У)(X)А(X, У), истинно тогда и только тогда, когда А (X, У) – тождественно-истинный предикат, (X)(У)А (X, У) и (Y)(X)А(X,У) оба истинны во всех случаях, кроме одного, когда А(X,У) – тождественно-ложный предикат. Все остальные высказывания существенно различны. Особенно следует помнить, что порядок следования разноименных кванторов очень важен.
Я считаю, что к окончанию школы ученики должны овладеть кванторами, но введение их должно быть постепенным и начинаться в простых ситуациях. Учащиеся должны хорошо понимать, что от перестановки кванторов может меняться смысл утверждения.
Например, Пусть I=(а,b) – некоторый интервал. Тогда «Для всякого хÎI существует такой у, что у = f (х)» ((x)(у) (у = f (х))), означает, что функция f(х) всюду определена на I. Напротив, «Существует такое у, что для всякого х у=f (х)» ((у)(х)(у=f(х))) означает, что функция f(x) принимает для всех х некоторое фиксированное значение у, т. е. постоянна.
Приведем еще один пример. Корректное определение периодичности всюду определенной функции f(х) выглядит с использованием кванторов так: (c)(x) (c¹0 ÙÙf(x+c) = f(x)), между тем если переставить кванторы и сформулировать утверждение «Для каждого х существует такое с, что с¹0 и что f(х + с) =f(x)»: (c)(x) (c¹0 Ùf(x+c) = f(x)), то это означает лишь, что функция принимает каждое значение больше чем один раз, т. е. нечто совсем иное.
В математическом анализе часто приходится сталкиваться с кванторами.
Определение предела последовательности из учебника «Алгебра и начала анализа» для 10-11 классов сформулировано так «Число А является пределом последовательности аn
, если для любого >0 существует номер N, такой, что при всех n>N верно неравенство ». В кванторном обозначении это определение записывается так:
( >0)(NÎN)(nÎN)((n>N) Þ
Переставлять кванторы нельзя: именно тот факт, что N под квантором существования следует за выражением (> 0), указывает на зависимость N от выбранного .
Как выразить утверждение, что последовательность (хn
) сходится? Надо указать на то, что предел A существует. С помощью кванторов это утверждение формулируется так:
(A) (> 0) (NÎN) (nÎN)((n > N) Þ ()).
Такая запись имеет еще и то преимущество, что она почти автоматически позволяет формулировать отрицание существования предела, означающее свойство расходимости. Для этого достаточно несколько раз применить правило де Моргана для кванторов: (хn
) расходится Ûù((A) (> 0) (NÎN) (nÎN)((n > N) Þ ()) Û(A)(> 0) (NÎN) (nÎN)((n > N) Ù).
Задания для учащихся.
Установите, какие из следующих высказываний истинны.
x (x + 1 = x); x (x2
+ x + 1>0); x (x2
- 5x + 6>0); x (x2
-6x+8³0 Ùx2
-4x+3>0); x (x2
- 5x + 6 ³ 0 Úx2
+ 5x + 6 < 0)
2) При каких аÎR истинны следующие высказывания: х (x2
+x + а>0);
x (x2
+x + а>0); х (x2
+ax + 1>0);
3) Пусть P(x) = «х – простое число»
E(x) = «х – четное число»
Z(x) = «х – целое число»
D(x,y) = «y делится на х»
G(x,y) = «х > y»
Расшифруйте следующие высказывания и выясните, какие из них истинны:
P(x)ÞùE(x); x (E(x) Ú D(x,6));
x(P(x)ÞùE(x); x(P(x)ÚE(x));
xy(D(x,y)ÞG(y,x)); xy(Z(x)ÙZ(y)ÞD(x,y));
xy(Z(x)ÙZ(y)ÞD(x,y)).
4) Запишите с помощью кванторов определение предела функции: число b называется пределом функции f(х) при х, стремящемся к а, если для любого положительного числа найдется такое положительное число , что при всех х ¹ а, удовлетворяющих неравенству ½х – а½<0, будет выполнено неравенство ½f (х) – b½< .
§5 Методические рекомендации к теме «Введение нуля и развитие позиционной десятичной системы счисления».
В 5 классе уже возможно обсуждение с учащимися этой темы.
Можно вспомнить с ними, что счет у нас ведется десятками: десять единиц образуют один десяток, десять десятков – одну сотню и т.д., иными словами: десять единиц первого разряда образуют одну единицу второго разряда, десять единиц второго разряда – одну единицу третьего разряда и т.д.
Такой способ счета, группами в десять, которым мы пользуемся, называется десятичной системой счисления. Число десять называется основанием десятичной системы счисления. Строго определения десятичной системы давать не стоит.
Затем, нужно обсудить, почему мы считаем именно десятками, то есть как возникла десятичная система счисления?
Люди на первых ступенях развития общества считали с помощью десяти пальцев рук. Сейчас иногда говорят: «Перечесть по пальцам».
Далее следует поговорить о том, что были племена и народы, которые при счете пользовались лишь пятью пальцами одной руки, считали пятками, поэтому и использовали они пятеричную систему счисления, в которой основой служит число 5.
Существуют и другие системы счисления: двоичная, двадцатеричная (следы ее сохранились до сих пор во французском языке – они говорят вместо «восьмидесяти» - «четырежды двадцать»). Двадцатеричная система возникла у народов, считавших не только с помощью пальцев рук, но и пальцев ног. Древние вавилоняне пользовались шестидесятеричной системой счисления.
Можно обсудить, сколько цифр используется в каждой из перечисленных систем счисления для изображения чисел.
Также полезно для учащихся будет ознакомиться с римской нумерацией, обсудить где она применяется. Учащиеся должны научиться записывать арабские числа с помощью римских. Тут же можно предложить им пару занимательных задач, где используют римские цифры с целью привлечения их внимания.
Больше никакие алфавитные системы не стоит затрагивать, а только продемонстрировать табличку с алфавитными нумерациями, а также числовые знаки различных народов (см. дальше).
После этого учащимся можно сообщить вкратце о происхождении знака 0.
Нужно отметить, что сейчас нуль это не просто знак для отделения разрядов, а число, которое можно складывать, вычитать, умножать и делить, как и другие числа. Единственное ограничение – делить на 0 нельзя.
Возможно вынесение этого материала на факультативные занятие, где обсуждению различных систем счисления можно отвести больше времени.
С учащимися 7-8 классов возможно более полное рассмотрение этой темы.
Начать следует с рассказа о том, что существуют позиционные и непозиционные системы счисления. Дать определения одной и другой системы счисления, попросить учащихся привести примеры.
Затем можно обсудить двоичную систему. Учащиеся должны научиться переводить числа из двоичной системы счисления в десятичную, и наоборот. После этого подобные действия проделать с другой системой счисления, например, пятеричной. Можно научить учащихся складывать и умножать числа в различных системах счисления, отличных от десятичной. Далее, я считаю, что нужно рассмотреть десятичную непозиционную систему (например, древних египтян). Учащиеся должны понять, насколько тяжело изображать большие числа в непозиционных системах счисления. Только тогда они смогут по достоинству оценить заслугу индийских математиков, которые создали десятичную позиционную систему счисления.
Прежде чем начать рассказ о происхождение знака нуля можно предложить учащимся записать число сто три тысячи двести пятьдесят с помощью цифр, но не используя знака нуля. Обсудить как они это сделали, далее предложить сложить это число с числом двадцать тысяч семьсот восемьдесят девять, опять таки записанного с помощью цифр, но без знака нуля. У учащихся возникнут некоторые затруднения. После этого будет целесообразно рассказать им о заслуге индийцев.
Если кто-то из учащихся заинтересуется нумерациями различных народов, то можно предложить им для самостоятельного изучения книгу Э. Кольмана «История математики в древности».
Список литературы
Алексеев Б. Т. Философские проблемы формализации знания. Издательство ленинградского университета. 1981.
Бурбаки Н. Очерки по истории математики. М., издательство иностранной литературы. 1963.
Вилейтнер Г. История математики от Декарта до середины XIX столетия. М., «Наука». 1966.
Выгодский М.Я. Арифметика и алгебра в древнем мире. М., «Наука». 1967.
Глейзер Г.И. История математики в школе. Пособие для учителей. Под ред. В.Н. Молодшего. М., «Просвещение», 1964.
Калужнин Л.А. Элементы теории множеств и математической логики в школьном курсе математики. Пособие для учителей. М., «Просвещение», 1978. 88с.
Нешков К.И. И др. Множества. Отношения. Числа. Величины. Пособие для учителей. М. «Просвещение», 1978. 63 с.
Марков С.Н. Курс истории математики: Учебное пособие. – Иркутск: Издательство иркутского университета, 1995. – 248с.
Молодший В.Н. Очерки по истории математики. М.
Никифоровский В.А. Из истории алгебры XVI-XVII вв.. М., «Наука». 1979.
Петров Ю.А. Философские проблемы математики. М., «Знание», 1973.
Погребысский И.Б. Гольфрид Вильгельм Лейбниц. М., «Наука». 1971.
Рыбников К.А. История математики. Издательство московского университета. 1974.
Таваркиладзе Р.К. О языке школьного курса математики. «Математика в школе».
Хрестоматия по истории математики. Арифметика и алгебра. Теория чисел. Геометрия. Пособие для студентов физ.-мат. фак. пед. институтов. Под ред. А.П. Юшкевича. М., «Просвещение», 1976.
Энциклопедический словарь юного математика. М., «Педагогика». 1989.
|