Статистическая обработка данных в MATLAB: поиск экстремумов, вычисление средних и стандартных отклонений, сортировка, корреляция и матрица ковариации

Дисциплина: Информатика, Программирование, Базы данных
Тип работы: Реферат
Бесплатно: Антиплагиат
Объем: 16 страниц
В избранное:

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РЕСПУБЛИКИ КАЗАХСТАН

Казахский национальный технический университет имени К. И. Сатпаева

Кафедра технической кибернетики

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

к курсовому проекту

Тема: Статистическая обработка данных

Руководитель

старший преподаватель

О. В. Киселева

Студент Черток Т. В.

Специальность 370441

Группа ИВТ 02-11р

Алматы 2004

СОДЕРЖАНИЕ

Задание

Задание: Введение

: 1

Задание: Статическая обработка данных

: 1. 1

Задание: Нахождение максимального и минимального элементов массива

: 1. 2

Задание: Нахождение средних, срединных значений массива и стандартных отклонений

: 1. 3

Задание: Функции сортировки элементов массива

: 1. 4

Задание: Вычисление коэффициентов корреляции

: 1. 5

Задание: Вычисление матрицы ковариации

Задание: Приложение

Задание: Заключение

Задание: Список литературы

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН

Казахский национальный технический университет имени К. И. Сатпаева

Специальность 370441 - Программное и аппаратное обеспечение вычислительной техники и сетей

Кафедра Технической кибернетики

ЗАДАНИЕ

на выполнение курсовой (работы)

Студенту Черток Татьяне Валерьевне

Содержание расчетно-пояснительной записки (перечень подлежащих разработке вопросов) : В курсовом проекте поставлена задача рассмотреть основные примеры статистической обработки данных.

Рассмотреть:

- нахождение максимальных и минимальных элементов массива;

- нахождение максимальных и минимальных элементов массива;: - нахождение средних, срединных значений массива и стандартных отклонений;

- нахождение максимальных и минимальных элементов массива;: - функции сортировки элементов массива;

- нахождение максимальных и минимальных элементов массива;: - вычисление коэффициентов корреляции;

- нахождение максимальных и минимальных элементов массива;: - вычисление матрицы ковариации.

Введение

В наши дни компьютерная математика получила должную известность и интенсивно развивается как передовое научное направление на стыке математики и информатики.

Программируемые микрокалькуляторы и персональные компьютеры уже давно применяются для математических расчетов. Для подготовки программ использовались различные универсальные языки программирования. В начале 90-х гг. на смену им пришли специализированные системы компьютерной математики (СКМ) . Среди них наибольшую известность получили системы Eureka, Mercury, Mathcad, Derive, Mathematica 2/3/4, Maple V R3/R4/R5 и Maple 6 и др. Каждая из этих систем имеет свои достоинства и недостатки и заслуживает отдельного рассмотрения.

В данном реферате рассматривается система MATLAB®, прошедшая многолетний путь развития от узко специализированного матричного программного модуля, используемого только на больших ЭВМ, до универсальной интегрированной СКМ, ориентированной на массовые персональные компьютеры класса IBM PC и Macintosh и рабочие станции UNIX и имеющей мощные средства диалога, графики и комплексной визуализации. MATLAB представляет собой хорошо апробированную и надежную СКМ, рассчитанную на решение самого широкого круга математических задач с представлением данных в универсальной (но не навязываемой пользователям) матричной форме, предложенной фирмой Math Works, Inc.

Система MATLAB предлагается разработчиками (фирма Math Works, Inc. ) как лидирующий на рынке, в первую очередь в системе военно-промышленного комплекса, в аэрокосмической отрасли и автомобилестроении, язык программирования высокого уровня для технических вычислений с большим числом стандартных пакетов прикладных программ. Система MATLAB вобрала в себя не только передовой опыт развития и компьютерной реализации численных методов, накопленный за последние три десятилетия, но и весь опыт становления математики за всю историю человечества. Около миллиона легально зарегистрированных пользователей уже применяют эту систему. Ее охотно используют в своих научных проектах ведущие университеты и научные центры мира. Популярности системы способствует ее мощное расширение Simulink, предоставляющее удобные и простые средства, в том числе визуальное объектно-ориентированное программирование, для моделирования линейных и нелинейных динамических систем, а также множество других пакетов расширения системы.

Таким образом, интерес к системе MATLAB остается у нас неудовлетворенным.

Система MATLAB 6. 0 появилась в конце 2000 г., а система MATLAB 6. 1 (в которой весьма существенно переработаны пакеты расширения, но в ядро системы добавлены лишь две команды для работы со звуком и команда strfind) - в июле 2001 г. MATLAB 6 является последней реализацией системы MATLAB. В новой реализации системы не только расширены ее возможности, но и радикально переработан и улучшен интерфейс пользователя, существенно обновился состав пакетов расширений.

MATLAB 6 сразу получила широкую известность у нас в Казахстане. Как это ни печально, известность пришла во многом благодаря появлению большого числа «пиратских» компакт-дисков, содержащих полные и вполне работоспособные поставки MATLAB 6. 0 со всеми ее дорогостоящими пакетами расширения (но, естественно, без русскоязычной документации) .

В этом реферате описываются функции системы MATLAB, предназначенные для реализации алгоритмов типовых численных методов решения прикладных задач и обработки данных. Наряду с базовыми операциями решения систем линейных и нелинейных уравнений рассмотрены функции вычисления конечных разностей, численного дифференцирования, численного интегрирования, триангуляции, аппроксимации Лапласиана и, наконец, прямого и обратного преобразования Фурье. Отдельные разделы посвящены работе с полиномами и численным методам решения обыкновенных дифференциальных уравнений.

Этот реферат посвящен статистической обработке данных. В нем приведены основные функции для статистической обработки данных, представленных массивами. Они широко используются для анализа данных физических, химических, экономических и иных экспериментов.

1 Статическая обработка данных

1. 1 Нахождение максимального и минимального элементов массива

Самый простой анализ данных, содержащихся в некотором массиве, заключается в поиске его элементов с максимальным и минимальным значениями. В системе MATLAB определены следующие быстрые функции для нахождения минимальных и максимальных элементов массива:

- mах(А) - возвращает наибольший элемент, если А - вектор; или возвращает вектор-строку, содержащую максимальные элементы каждого столбца, если А - матрица, в многомерных массивах работает с первой не единичной размерности;

- mах(А, В) - возвращает массив того же размера, что А и В, каждый элемент которого есть максимальный из соответствующих элементов этих массивов;

- max(A, [ ], dim) - возвращает наибольшие элементы по столбцам или по строкам матрицы в зависимости от значения скаляра dim. Например, mах(А, [ ], 1) возвращает максимальные элементы каждого столбца матрицы А;

- [C, I] =max(A) - кроме максимальных значений возвращает вектор индексов I этих элементов.

Для быстрого нахождения элемента массива с минимальным значением служит следующая функция:

- min(A) - возвращает минимальный элемент, если А - вектор; или

возвращает вектор-строку, содержащую минимальные элементы каждого столбца, если А - матрица;

- min(A, B) - возвращает массив того же размера, что А и В, каждый элемент которого есть минимальный из соответствующих элементов этих массивов;

- min(A, [ ], dim) - возвращает наименьший элемент по столбцам или по строкам матрицы в зависимости от значения скаляра dim. Например, mах(А, [ ], 1) возвращает минимальные элементы каждого столбца матрицы А;

- [C, I] = min(A) - кроме минимальных значений возвращает вектор индексов этих элементов.

Работа указанных функций базируется на сравнении численных значений элементов массива А, что и обеспечивает высокую скорость выполнения операций. Примеры этих функций приведены в приложении A.

Нахождение средних, срединных значений массива и стандартных отклонений

Элементарная статистическая обработка данных в массиве обычно сводится к нахождению их среднего значения, медианы (срединного значения) и стандартного отклонения. Для этого в системе MATLAB определены следующие функции:

- mean (А) - возвращает арифметическое среднее значение элементов

массива, если А - вектор; или возвращает вектор-строку, содержащую средние значения элементов каждого столбца, если А - матрица. Арифметическое среднее значение есть сумма элементов массива, деленная на их число;

- mean(A, dim) - возвращает среднее значение элементов по столбцам или по строкам матрицы в зависимости от значения скаляра dim (dim=l по столбцам и dim=2 по строкам соответственно) .

- median (A) - возвращает медиану, если А - вектор; или вектор-строку медиан для каждого столбца, если А - матрица;

- median(A, dim) - возвращает значения медиан для столбцов или строк матрицы в зависимости от значения скаляра dim.

- std(X) - возвращает стандартное отклонение элементов массива,

вычисляемое по формуле если X - вектор. Если X - матрица, то std(X) возвращает вектор-строку, содержащую стандартное отклонение элементов каждого столбца (обратите внимание, что оно отличается от среднеквадратического отклонения) ;

- std(X, flag) - возвращает то же значение, что и std(X), если flag=0; если flag=l, функция std(X. l) возвращает среднеквадратическое отклонение (квадратный корень из несмещенной дисперсии), вычисляемое по формуле

- std(X. flag. dim) - возвращает стандартное или среднеквадратическое отклонения по рядам (dim=2) или по столбцам(dim=1) матрицы X в зависимости от значения переменной dim. Примеры использования этих функций отображены в приложении B.

Функции сортировки элементов массива

Многие операции статистической обработки данных выполняются быстрее и надежнее, если данные предварительно отсортированы. Кроме того, нередко представление данных в отсортированном виде более наглядно и ценно. Ряд функций служит для выполнения сортировки элементов массива. Они представлены ниже.

- sort (А) - в случае одномерного массива А сортирует и возвращает элементы по возрастанию их значений; в случае двумерного массива происходит сортировка и возврат элементов каждого столбца. Допустимы вещественные, комплексные и строковые элементы. Если А принимает комплексные значения, то элементы сначала сортируются по абсолютному значению, а затем, если абсолютные значения равны, по аргументу;

- [В, INDEX] = sort(A) - наряду с отсортированным массивом возвращает массив индексов INDEX. Он имеет размер size(A), с помощью этого массива можно восстановить структуру исходного массива;

- sort(A, dim) - для матриц сортирует элементы по столбцам (dim=l) или по рядам в зависимости от значения переменной dim.

- sortrows(A) - выполняет сортировку строк массива А по возрастанию и возвращает отсортированный массив. Массив может быть задан матрицей или вектором-столбцом;

- sortrows(A, column) - возвращает матрицу, отсортированную по столбцам, точно указанным в векторе column. Например, sortrows(A, [2 3] ) сортирует строки матрицы А сначала по второму столбцу, и затем, если его элементы равны, по третьему;

- [В, index] = sort rows (А) - также возвращает вектор индексов index. Если А - вектор-столбец, то B=A(index) . Если А - матрица размера mхn, то B=A(index) ;

- cplxpair(A) - сортирует элементы по строкам или столбцам комплексного массива А, группируя вместе комплексно сопряженные пары. Затем найденные пары сортируются по возрастанию действительной части. Внутри пары элемент с отрицательной мнимой частью является первым. Действительные элементы следуют за комплексными парами. Заданный по умолчанию порог 100*eps относительно abs(A(i) ) определяет, какие числа являются действительными и какие элементы являются комплексно сопряженными. Если А - вектор, cplxpair (А) возвращает А вместе с комплексно сопряженными парами. Если А - матрица, cplxpair(А) возвращает матрицу А с комплексно сопряженными парами, сортированную по столбцам;

- cplxpalr(A, tol) - отменяет заданный по умолчанию порог и задает новый tol;

- cplxpair(A. [] . dim) - сортирует матрицу А по строкам или по столбцам в зависимости от значения параметра dim;

- cplxpair(A, tol, dim) - сортирует матрицу А по строкам или по столбцам в зависимости от значения параметра dim, используя заданный порог tol. Примеры приведены в приложении D.

1. 4 Вычисление коэффициентов корреляции

Под корреляцией понимается взаимосвязь некоторых величин, представленных данными - векторами или матрицами. Общепринятой мерой линейной корреляции является коэффициент корреляции. Его близость к единице указывает на высокую степень линейной зависимости. Данный раздел посвящен описанию функции для вычисления коэффициентов корреляции и определения ковариационной матрицы элементов массива. Приведенная ниже функция позволяет вычислить коэффициенты корреляции для входного массива данных.

- corrcoef(X) - возвращает матрицу коэффициентов корреляции для входной матрицы, строки которой рассматриваются как наблюдения, а столбцы - как переменные. Матрица S=corrcoef(X) связана с матрицей ковариацийC=cov(X) следующим соотношением: S(i. j) =C(i. j) /sqrt(C(i. i) C(j. j) ) ;

- Функция S = corrcoef (х, у), где х и у - векторы-столбцы, аналогична функции соrrсоеf([х у] ) . Примеры в приложении D.

1. 5 Вычисление матрицы ковариации

Приведенная далее функция позволяет вычислить матрицу ковариации для массива данных.

- cov(x) - возвращает смещенную дисперсию элементов вектора х. Для матрицы, где каждая строка рассматривается как наблюдение, а каждый столбец - как переменная, cov(x) возвращает матрицу ковариации.

- diag(cov(x» - вектор смещенных дисперсий для каждого столбца и sqrt(diag(cov(x) ) ) - вектор стандартных отклонений.

... продолжение

Вы можете абсолютно на бесплатной основе полностью просмотреть эту работу через наше приложение.