Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

ON THE CONTENT ASPECT OF THE STUDY OF MATHEMATICAL PROOF BY THE EXAMPLE OF THE KRONECKER-CAPELLI THEOREM IN THE COURSE OF LINEAR ALGEBRA

Fokin R.R. 1
1 Military Space Academy named after A.F. Mozhaiskiy
Of the 3 aspects of the learning process (substantive, methodological, pragmatic), the article touches on the content one. A method for improving the proof of the Kronecker – Capelli theorem in the course of linear algebra is described. As a result, an optimal proof is constructed in the sense of students’ understanding of it. The result does not claim any contribution directly to mathematical science, it is a scientific pedagogical result. The article discusses a significant number of textbooks on linear algebra. For each manual, the context of the proof of this theorem is constructed, that is, in addition to the content of the proof, substantive topics, concepts and theorems were considered, with the help of which the proof in question was produced. Based on the analysis of all these contexts by logical and mathematical methods, the optimal context of the proof of the Kronecker – Capelli theorem was constructed (in the sense of understanding it by students). For optimization, a decomposition method similar to that used in structural programming was used: the project should not contain large program modules (consisting of more than 10 operators), large modules should be divided into parts. As a result, there will be more theorems and concepts, but at the same time they will be easier to understand. The described procedure can be applied to any other mathematical theorem, since the logical features of the proof of the Kronecker – Capelli theorem have nothing to do with this procedure.
mathematics
learning to reason
linear algebra
learning friendliness
theorem
proof
context optimization
decomposition

Изучение математики школьником и студентом имеет целью, в частности, научить их корректно рассуждать и доказывать в смысле парадигмы математической науки. Отсюда большая проблема в обучении математике и актуальность настоящей статьи.

Выделяют три аспекта обучения: 1) содержание обучения (чему учить?); 2) методика обучения (как учить?); 3) прагматика обучения (зачем учить?). Цель настоящего исследования – выявление методов улучшения результатов обучения рассуждать и доказывать путем изменения содержания доказательств теорем. Методику и прагматику обучения настоящая статья не затрагивает.

Материалы и методы исследования

Основные материалы настоящего исследования – это существующие учебные курсы линейной алгебры, отличающиеся способами доказательства теоремы Кронекера – Капелли. Основные методы настоящего исследования:

1. Выявление в каждом пособии контекста доказательства теоремы Кронекера – Капелли (ТКК) – способа ее доказательства и непосредственно связанных с ним понятий и теорем.

2. Классификация этих контекстов и построение оптимального контекста, исходя из цели нашего исследования.

Замечания. Представленные в статье методы не способны полностью решить поставленную выше проблему, они лишь способствуют ее решению. В большей степени нами применяются эвристические и индуктивные методы, дедуктивные применяются реже, поэтому результаты допускают плюрализм в их интерпретации.

Результаты исследования и их обсуждение

Весьма полезными для настоящей статьи были методы корректировки содержания различных математических курсов [1–3], предложенные нашими коллегами. Цель состояла в том, чтобы новое содержание курса легче понимал студент. Для этого корректировалась вся система понятий и теорем такого курса. Ими рассматривались курсы дифференциальных уравнений, уравнений математической физики, вычислительных методов, общий курс математики. Статьи [4, 5] показывают особую важность подобной деятельности именно в настоящее время, когда из-за динамичных изменений социальной среды и психологии человека резко возросли трудности в изучении математики.

Задача данной статьи имеет особенность – изменить сложный для понимания фрагмент некоторого учебного курса, а не весь курс, например упростить доказательство ТКК в курсе линейной алгебры (КЛЛ). Для этого нет необходимости корректировать весь КЛЛ, достаточно выявить и скорректировать контекст ТКК. В статье [6] выявлено около десятка подобных проблемных фрагментов в различных математических курсах. Описанная ниже процедура для ТКК может быть применена к любому другому фрагменту математического курса, поскольку логические особенности доказательства ТКК никак с этой процедурой не связаны.

Статья [7] для облегчения понимания при обучении студента программированию советует не использовать больших программных модулей, содержащих более 10 операторов. Большие программные модули нужно подвергать декомпозиции – разбивать на несколько малых, использующих друг друга. Это принцип структурного программирования, его следует применять и в процессе профессионального программирования. Аналогично следует сложную теорему с длинным доказательством подвергать декомпозиции на несколько простых теорем с коротким доказательством. Одно длинное определение сложного понятия следует преобразовать в несколько коротких определений простых понятий. В результате понятий и теорем станет больше, но каждое из них станет проще для понимания. Это и есть основной метод корректировки сложного фрагмента учебного курса.

AX=B, где A ∈ RmXn, X ∈ RnX1, B ∈ RmX1,(1)

aj1 x1 + ... + ajn xn = bj, (2)

где xi=xi1 при i=1...n, bj=bj1 при j=1...m,

C=[A|B], C ∈ RmXn+1. (3)

Пусть имеется (1) – система m линейных уравнений с n неизвестными над R – действительными числами, хотя все приведенные ниже рассуждения истинны и для C – комплексных чисел. При i = 1...n вместо xi1 будем писать xi – это неизвестные. При j = 1...m вместо bj1 будем писать bj – это свободные члены системы. Тогда (2) – это j-е уравнение системы (1). Если система (1) имеет хотя бы одно решение, то говорят, что она совместна. Если к матрице A справа присоединить столбец B, то получится (3) матрица C, А называют матрицей системы (1), B – называют ее расширенной матрицей.

Теорема 1 (Кронекера – Капелли): система (1) совместна ⇔ rank A = rank C = r – обозначим это число так. Здесь rank – ранг соответствующей матрицы. Эта теорема имеет два следствия:

Следствие 1.1: r = n ⇒ система (1) имеет единственное решение.

Следствие 1.2: r < n ⇒ система (1) имеет бесконечное множество решений. При этом n-r неизвестных объявляются свободными. Это означает, что им могут быть присвоены любые значения. Остальные r неизвестных объявляются главными, это означает, что каждое из них может быть выражено через свободные неизвестные.

x1 A1 + ... + xn An = B, (4)

где A1...An – столбцы A.

Система (1) может быть представлена в эквивалентной форме (4), что позволяет легко доказать теорему 1 в одну из сторон (⇒). Пусть x1=p1, ..., xn=pn – решение системы (1)–(4), где p1, ..., pn – некоторые числа, тогда p1 A1 + ... + pn An = B ⇒ B – p1 A1 – ... – pn An = O, где O – m-мерный нулевой столбец. Прибавление к некоторому столбцу матрицы другого ее столбца, умноженного на любое число – это одно из так называемых элементарных преобразований матрицы (не меняющих ранг матрицы). К последнему столбцу B матрицы C применим n раз такое элементарное преобразование, получим последовательность матриц одинакового ранга:

C=[A|B]=[A1|A2| ... |An|B]

[A1|A2| ... |An|B-p1A1]

...

[A1|A2| ... |An|B-p1A1-...-pnAn]=[A|O]

Отсюда, rank C = rank [A|O], но также rank [A|O] = rank A, следовательно, rank C = rank A, что и требовалось доказать.

Доказательство теоремы 1 в другую сторону () не столь очевидно. Теперь дано, что rank A = rank C = r, нужно доказать, что система (1)–(4) эквивалентна в смысле множества решений другой системе, совместность которой почти очевидна. Вводится понятие элементарных преобразований над системой (1)–(4) в смысле неизменности множества решений системы: 1) перестановка двух уравнений; 2) умножение уравнения на ненулевое число; 3) сложение уравнения с другим, умноженным на любое число; 4) исключение из системы уравнения со всеми нулевыми значениями коэффициентов и свободного члена. Эти преобразования уравнений эквивалентны соответствующим преобразованиям расширенной матрицы системы: 1) перестановка двух строк; 2) умножение строки на ненулевое число; 3) сложение строки с другой, умноженной на число; 4) исключение из матрицы нулевой строки. Можно аналогичные преобразования проводить и над столбцами матрицы системы, при этом мы переходим к новой эквивалентной системе неизвестных x1’, ..., xn’, поскольку существуют взаимно-однозначные отображения между старой и новой системами неизвестных.

[A’|A’’|B’] при r<n, (5)

где A’ ∈ RrXr, det A’≠0, A’ – треугольная,

A’’ ∈ RrXn-r, B’ – r-мерный столбец;

[A’|B’] при r=n, (6)

где A’ ∈ RrXr, det A’≠0, A’ – треугольная,

B’ – r-мерный столбец.

Автор статьи при обучении в вузе на лекции по КЛЛ встретился с таким доказательством ТКК: по мнению лектора, очевидно, что, используя только указанные выше 4 операции над строками расширенной матрицы системы (1), всегда можно расширенную матрицу преобразовать при r < n к виду (5) и при r = n к виду (6).

A’ X = B’, (7)

[A’|A”] X = B’ . (8)

При r = n система приобретет вид (7), поскольку det A’≠0, то в данном случае существует единственное решение. При r < n система приобретет вид (8). В этом случае разобьем столбец X на верхнюю X1...r и нижнюю Xr+1...n части – это тоже столбцы. В X1...r входят неизвестные x1...xr, в Xr+1...n – xr+1...xn.

A’ X1...r + A” Xr+1...n = B’, (9)

A’ X1...r = B’ – A” Xr+1...n. (10)

Теперь систему можно представить в виде (9). Неизвестные xr+1...xn объявим свободными и подставим вместо них произвольные числа, тогда m-мерный столбец A’’ Xr+1...n будет состоять из чисел, перенесем его в правую часть системы, и она приобретет вид (10), где r уравнений и r неизвестных x1...xr, их мы объявим главными. Поскольку det A’≠0, то в данном случае существует единственное решение системы (10), следовательно, x1...xr выражаются единственным образом через xr+1...xn.

Таким образом, теорема 1 доказана также в другую () сторону. Треугольный вид матрицы A’ не использовался, хотя при det A’≠0 матрицу A’ можно преобразовать к треугольному виду по методу Гаусса. Доказательство не плохое, поскольку попутно доказаны следствия 1.1 и 1.2 к этой теореме. Однако начало доказательства формально отсутствует, поскольку очевидность – это не математический научный термин. В некоторых случаях виды расширенных матриц (5) и (6) невозможно получить без операции перестановки двух столбцов матрицы системы, а лектором говорилось только об операциях со строками. Если также разрешить операцию перестановки столбцов, то преобразование к видам (5) и (6) становится возможным. Таким образом, математически ложное утверждение выдавалось студентам за очевидное.

В статье [6] можно найти около десятка подобных примеров. Следовательно, можно говорить о сложившемся стиле обучения точным наукам, сущностью которого является некорректное декларирование очевидности. Оно подразделяется на 2 типа: 1) декларируется очевидность ложного утверждения; 2) декларируется очевидность истинного утверждения, доказательство которого очень сложное. В обоих случаях у большого количества студентов развивается комплекс неполноценности при изучении данной дисциплины.

Школьники и студенты учатся рассуждать и доказывать: 1) на примерах воспринятых ими корректных рассуждений и доказательств; 2) на основе обобщения этих примеров; 3) на основе конкретизации сделанных выводов и построения собственных рассуждений и доказательств. За более чем 30 лет преподавания точных наук в вузах автор наблюдал большое количество студентов, для которых количество воспринятых корректных рассуждений и доказательств за все время обучения (включая среднюю школу) было очень малым (возможно, нулевым). Соответственно, в своем личностном развитии до обобщения они в принципе дойти не могли. У такого студента неизбежно формируется механизм выживания в вузе, включающий навыки подсказки, списывания и более сложные инструменты. Ниже приведен пример реализации такого инструмента, который можно назвать псевдологикой. Его реализации могут быть различными, суть в том, что если логики у студента в наличии нет, то для выживания ему необходимо ее каким-то инструментом псевдологики заменить. Тысячи наблюдений автора за ответами студентов на практических занятиях и экзаменах по точным наукам указывают, что большое количество студентов считает, что логика – это особый стиль речи и письма; например: дана непрерывная на R функция... требуется доказать ее разрывность во всех точках трехмерного пространства... Это не попытка обмануть педагога. За это студента нельзя наказывать. Такой студент считает, что это и есть логика. После окончания вуза человек продолжает псевдологику считать логикой и, например, становится жертвой мошенников. Псевдологика частично базируется на научной математической основе: 1) по Гильберту существуют различные логики, в том числе и такие, которые не покажутся адекватными; 2) существуют теоремы Геделя о неполноте практически всех логик. Существуют и психологические компоненты псевдологики.

Заметим, что часто в учебных пособиях [8–10], куда входит линейная алгебра, упоминают формулировку ТКК, но не приводят ее доказательства. Это допустимо. Большое количество доказательств в небольшом учебном курсе неизбежно приводит к снижению их качества. Не воспринятые студентом рассуждения и доказательства приносят большой вред на пути его личностного развития. В пособии [11] тоже лишь упоминается формулировка ТКК, но при этом присутствует с доказательствами весь контекст самого оптимального доказательства этой теоремы. В таких условиях построение доказательства ТКК в обе стороны можно было бы в книгу включить в качестве упражнения для студентов.

Пособие [12] содержит доказательство ТКК, которое автор настоящей статьи изучал, будучи студентом. Авторы пособий физически не могут сами доказать все теоремы из них. Они берут эти доказательства из других пособий такими, как они есть, с достоинствами и недостатками. Пособия [13, 14] содержат упоминавшийся выше оптимальный в смысле понимания студентами контекст доказательства ТКК. Напоминаем, пособие [11] тоже содержит этот контекст, но лишь частично. Что же входит в этот контекст, кроме ТКК и ее доказательства? Например, теорема о том, что если система (1) имеет квадратную матрицу A и det A≠0, тогда система (1) имеет единственное решение. Однако эта ветвь контекста нам пока не интересна из-за отсутствия идей о том, что можно было бы там изменить, чтобы доказательство ТКК стало бы короче. Другая ветвь рассматриваемого контекста – тема «Ранг матрицы». В пособиях [11, 13, 14] в эту тему добавлено понятие базисного минора прямоугольной матрицы – это один из миноров, реализующих ранг этой матрицы. Строки и столбцы, входящие в базисный минор, называют базисными. Заметим, что в результате само определение ранга матрицы становится легче понимаемым, оно становится нагляднее (это порядок минора, на который можно прямо указать). Доказывается теорема о базисном миноре. После этого доказательство теоремы 1 в нетривиальную сторону () становится совсем коротким, но в нем доказательства следствий 1.1 и 1.2 – таково содержание пособий [13, 14]. Нам известно, как исправить этот недостаток относительно следствий. Нужна совсем простая модернизация доказательства ТКК, приводимого в пособиях [13, 14]. Ниже мы приводим описание нашего модернизированного оптимального контекста (МОК) доказательства ТКК.

Теорема 2 (О базисном миноре): Имеется матрица и ее базисный минор, тогда:

1) базисные строки матрицы линейно независимы. Аналогично для базисных столбцов; 2) любая не базисная строка матрицы есть линейная комбинация ее базисных строк. Аналогично для столбцов матрицы.

Модернизированное доказательство теоремы 1 в нетривиальную сторону ()

У матрицы A есть базисный минор порядка r. Строки расширенной матрицы можно переставлять и столбцы матрицы системы можно переставлять. Поэтому мы можем считать, что базисные строки имеют номера 1...r и базисные столбцы имеют номера 1...r. Всякая не базисная строка расширенной матрицы есть линейная комбинация ее базисных строк – строк с номерами 1...r. Проводя элементарные операции над строками расширенной матрицы с номерами r+1...n, мы сделаем эти строки нулевыми, такие строки из расширенной матрицы можно удалить.

[A’|A»|B’] при r<n, (11)

где A’ ∈ RrXr, det A’≠0,

A’’ ∈ RrXn-r, B’ – r-мерный столбец;

[A’|B’] при r=n, (12)

где A’ ∈ RrXr, det A’≠0,

B’ – r-мерный столбец.

В результате преобразованная система будет эквивалентна исходной и расширенная матрица преобразованной системы будет при r < n иметь вид (11) и при r = n иметь вид (12). Далее повторяется то же самое содержание, что идет после формул (5) и (6) до слов «Таким образом, теорема 1 доказана также в другую () сторону». Не надо повторять только слова о треугольном виде матрицы A’, он в доказательстве не используется и не нужен.

В пособии [15] ТКК выводится из теоремы Фредгольма о совместности системы линейных уравнений. В теме «Ранг матрицы» сначала вводятся понятия ранга по столбцам и ранга по строкам, затем доказывается их равенство. Вводится понятие ранга матрицы. Доказывается теорема о ранге матрицы. Контекст доказательства ТКК в пособии [15] значительно сложнее для понимания, чем в пособии [14]. Однако нельзя не учитывать того, что читатель пособия [15] получает значительно более разнообразную информацию о большем количестве теорем, понятий и их связи между собой.

Заключение

1. Цель настоящего исследования – выявление методов улучшения содержания доказательств математических теорем и результатов обучения студентов рассуждать и доказывать. Некоторые из таких методов выявлены и практически описаны. Выявить все такие методы невозможно. Следовательно, цель настоящего исследования достигнута.

2. Оптимизирован контекст доказательства ТКК при изучении КЛЛ. При этом использовались логико-математические методы. Однако полученный результат не математический, а педагогический.

3. Введенное в статье понятие и определяемое им явление выживания студента в вузе представляет собой педагогическую реальность, ее в перспективе необходимо изучать.