Статистическая обработка данных


Тип работы: Реферат
Бесплатно: Антиплагиат
Объем: 16 страниц
В избранное:
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РЕСПУБЛИКИ КАЗАХСТАН
Казахский национальный технический университет имени К. И. Сатпаева
Кафедра технической кибернетики
ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
к курсовому проекту
Тема: Статистическая обработка данных
Руководитель
старший преподаватель
О. В. Киселева
Студент Черток Т. В.
Специальность 370441
Группа ИВТ 02-11р
Алматы 2004
СОДЕРЖАНИЕ
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН
Казахский национальный технический университет имени К. И. Сатпаева
Специальность 370441 - Программное и аппаратное обеспечение вычислительной техники и сетей
Кафедра Технической кибернетики
ЗАДАНИЕ
на выполнение курсовой (работы)
Студенту Черток Татьяне Валерьевне
Содержание расчетно-пояснительной записки (перечень подлежащих разработке вопросов) : В курсовом проекте поставлена задача рассмотреть основные примеры статистической обработки данных.
Рассмотреть:
Введение
В наши дни компьютерная математика получила должную известность и интенсивно развивается как передовое научное направление на стыке математики и информатики.
Программируемые микрокалькуляторы и персональные компьютеры уже давно применяются для математических расчетов. Для подготовки программ использовались различные универсальные языки программирования. В начале 90-х гг. на смену им пришли специализированные системы компьютерной математики (СКМ) . Среди них наибольшую известность получили системы Eureka, Mercury, Mathcad, Derive, Mathematica 2/3/4, Maple V R3/R4/R5 и Maple 6 и др. Каждая из этих систем имеет свои достоинства и недостатки и заслуживает отдельного рассмотрения.
В данном реферате рассматривается система MATLAB®, прошедшая многолетний путь развития от узко специализированного матричного программного модуля, используемого только на больших ЭВМ, до универсальной интегрированной СКМ, ориентированной на массовые персональные компьютеры класса IBM PC и Macintosh и рабочие станции UNIX и имеющей мощные средства диалога, графики и комплексной визуализации. MATLAB представляет собой хорошо апробированную и надежную СКМ, рассчитанную на решение самого широкого круга математических задач с представлением данных в универсальной (но не навязываемой пользователям) матричной форме, предложенной фирмой Math Works, Inc.
Система MATLAB предлагается разработчиками (фирма Math Works, Inc. ) как лидирующий на рынке, в первую очередь в системе военно-промышленного комплекса, в аэрокосмической отрасли и автомобилестроении, язык программирования высокого уровня для технических вычислений с большим числом стандартных пакетов прикладных программ. Система MATLAB вобрала в себя не только передовой опыт развития и компьютерной реализации численных методов, накопленный за последние три десятилетия, но и весь опыт становления математики за всю историю человечества. Около миллиона легально зарегистрированных пользователей уже применяют эту систему. Ее охотно используют в своих научных проектах ведущие университеты и научные центры мира. Популярности системы способствует ее мощное расширение Simulink, предоставляющее удобные и простые средства, в том числе визуальное объектно-ориентированное программирование, для моделирования линейных и нелинейных динамических систем, а также множество других пакетов расширения системы.
Таким образом, интерес к системе MATLAB остается у нас неудовлетворенным.
Система MATLAB 6. 0 появилась в конце 2000 г., а система MATLAB 6. 1 (в которой весьма существенно переработаны пакеты расширения, но в ядро системы добавлены лишь две команды для работы со звуком и команда strfind) - в июле 2001 г. MATLAB 6 является последней реализацией системы MATLAB. В новой реализации системы не только расширены ее возможности, но и радикально переработан и улучшен интерфейс пользователя, существенно обновился состав пакетов расширений.
MATLAB 6 сразу получила широкую известность у нас в Казахстане. Как это ни печально, известность пришла во многом благодаря появлению большого числа «пиратских» компакт-дисков, содержащих полные и вполне работоспособные поставки MATLAB 6. 0 со всеми ее дорогостоящими пакетами расширения (но, естественно, без русскоязычной документации) .
В этом реферате описываются функции системы MATLAB, предназначенные для реализации алгоритмов типовых численных методов решения прикладных задач и обработки данных. Наряду с базовыми операциями решения систем линейных и нелинейных уравнений рассмотрены функции вычисления конечных разностей, численного дифференцирования, численного интегрирования, триангуляции, аппроксимации Лапласиана и, наконец, прямого и обратного преобразования Фурье. Отдельные разделы посвящены работе с полиномами и численным методам решения обыкновенных дифференциальных уравнений.
Этот реферат посвящен статистической обработке данных. В нем приведены основные функции для статистической обработки данных, представленных массивами. Они широко используются для анализа данных физических, химических, экономических и иных экспериментов.
1 Статическая обработка данных
1. 1 Нахождение максимального и минимального элементов массива
Самый простой анализ данных, содержащихся в некотором массиве, заключается в поиске его элементов с максимальным и минимальным значениями. В системе MATLAB определены следующие быстрые функции для нахождения минимальных и максимальных элементов массива:
- mах(А) - возвращает наибольший элемент, если А - вектор; или возвращает вектор-строку, содержащую максимальные элементы каждого столбца, если А - матрица, в многомерных массивах работает с первой не единичной размерности;
- mах(А, В) - возвращает массив того же размера, что А и В, каждый элемент которого есть максимальный из соответствующих элементов этих массивов;
- max(A, [ ], dim) - возвращает наибольшие элементы по столбцам или по строкам матрицы в зависимости от значения скаляра dim. Например, mах(А, [ ], 1) возвращает максимальные элементы каждого столбца матрицы А;
- [C, I] =max(A) - кроме максимальных значений возвращает вектор индексов I этих элементов.
Для быстрого нахождения элемента массива с минимальным значением служит следующая функция:
- min(A) - возвращает минимальный элемент, если А - вектор; или
возвращает вектор-строку, содержащую минимальные элементы каждого столбца, если А - матрица;
- min(A, B) - возвращает массив того же размера, что А и В, каждый элемент которого есть минимальный из соответствующих элементов этих массивов;
- min(A, [ ], dim) - возвращает наименьший элемент по столбцам или по строкам матрицы в зависимости от значения скаляра dim. Например, mах(А, [ ], 1) возвращает минимальные элементы каждого столбца матрицы А;
- [C, I] = min(A) - кроме минимальных значений возвращает вектор индексов этих элементов.
Работа указанных функций базируется на сравнении численных значений элементов массива А, что и обеспечивает высокую скорость выполнения операций. Примеры этих функций приведены в приложении A.
- Нахождение средних, срединных значений массива и стандартных отклонений
Элементарная статистическая обработка данных в массиве обычно сводится к нахождению их среднего значения, медианы (срединного значения) и стандартного отклонения. Для этого в системе MATLAB определены следующие функции:
- mean (А) - возвращает арифметическое среднее значение элементов
массива, если А - вектор; или возвращает вектор-строку, содержащую средние значения элементов каждого столбца, если А - матрица. Арифметическое среднее значение есть сумма элементов массива, деленная на их число;
- mean(A, dim) - возвращает среднее значение элементов по столбцам или по строкам матрицы в зависимости от значения скаляра dim (dim=l по столбцам и dim=2 по строкам соответственно) .
- median (A) - возвращает медиану, если А - вектор; или вектор-строку медиан для каждого столбца, если А - матрица;
- median(A, dim) - возвращает значения медиан для столбцов или строк матрицы в зависимости от значения скаляра dim.
- std(X) - возвращает стандартное отклонение элементов массива,
вычисляемое по формуле если X - вектор. Если X - матрица, то std(X) возвращает вектор-строку, содержащую стандартное отклонение элементов каждого столбца (обратите внимание, что оно отличается от среднеквадратического отклонения) ;
- std(X, flag) - возвращает то же значение, что и std(X), если flag=0; если flag=l, функция std(X. l) возвращает среднеквадратическое отклонение (квадратный корень из несмещенной дисперсии), вычисляемое по формуле
- std(X. flag. dim) - возвращает стандартное или среднеквадратическое отклонения по рядам (dim=2) или по столбцам(dim=1) матрицы X в зависимости от значения переменной dim. Примеры использования этих функций отображены в приложении B.
- Функции сортировки элементов массива
Многие операции статистической обработки данных выполняются быстрее и надежнее, если данные предварительно отсортированы. Кроме того, нередко представление данных в отсортированном виде более наглядно и ценно. Ряд функций служит для выполнения сортировки элементов массива. Они представлены ниже.
- sort (А) - в случае одномерного массива А сортирует и возвращает элементы по возрастанию их значений; в случае двумерного массива происходит сортировка и возврат элементов каждого столбца. Допустимы вещественные, комплексные и строковые элементы. Если А принимает комплексные значения, то элементы сначала сортируются по абсолютному значению, а затем, если абсолютные значения равны, по аргументу;
- [В, INDEX] = sort(A) - наряду с отсортированным массивом возвращает массив индексов INDEX. Он имеет размер size(A), с помощью этого массива можно восстановить структуру исходного массива;
- sort(A, dim) - для матриц сортирует элементы по столбцам (dim=l) или по рядам в зависимости от значения переменной dim.
- sortrows(A) - выполняет сортировку строк массива А по возрастанию и возвращает отсортированный массив. Массив может быть задан матрицей или вектором-столбцом;
- sortrows(A, column) - возвращает матрицу, отсортированную по столбцам, точно указанным в векторе column. Например, sortrows(A, [2 3] ) сортирует строки матрицы А сначала по второму столбцу, и затем, если его элементы равны, по третьему;
- [В, index] = sort rows (А) - также возвращает вектор индексов index. Если А - вектор-столбец, то B=A(index) . Если А - матрица размера mхn, то B=A(index) ;
- cplxpair(A) - сортирует элементы по строкам или столбцам комплексного массива А, группируя вместе комплексно сопряженные пары. Затем найденные пары сортируются по возрастанию действительной части. Внутри пары элемент с отрицательной мнимой частью является первым. Действительные элементы следуют за комплексными парами. Заданный по умолчанию порог 100*eps относительно abs(A(i) ) определяет, какие числа являются действительными и какие элементы являются комплексно сопряженными. Если А - вектор, cplxpair (А) возвращает А вместе с комплексно сопряженными парами. Если А - матрица, cplxpair(А) возвращает матрицу А с комплексно сопряженными парами, сортированную по столбцам;
- cplxpalr(A, tol) - отменяет заданный по умолчанию порог и задает новый tol;
- cplxpair(A. [] . dim) - сортирует матрицу А по строкам или по столбцам в зависимости от значения параметра dim;
- cplxpair(A, tol, dim) - сортирует матрицу А по строкам или по столбцам в зависимости от значения параметра dim, используя заданный порог tol. Примеры приведены в приложении D.
1. 4 Вычисление коэффициентов корреляции
Под корреляцией понимается взаимосвязь некоторых величин, представленных данными - векторами или матрицами. Общепринятой мерой линейной корреляции является коэффициент корреляции. Его близость к единице указывает на высокую степень линейной зависимости. Данный раздел посвящен описанию функции для вычисления коэффициентов корреляции и определения ковариационной матрицы элементов массива. Приведенная ниже функция позволяет вычислить коэффициенты корреляции для входного массива данных.
- corrcoef(X) - возвращает матрицу коэффициентов корреляции для входной матрицы, строки которой рассматриваются как наблюдения, а столбцы - как переменные. Матрица S=corrcoef(X) связана с матрицей ковариацийC=cov(X) следующим соотношением: S(i. j) =C(i. j) /sqrt(C(i. i) C(j. j) ) ;
- Функция S = corrcoef (х, у), где х и у - векторы-столбцы, аналогична функции соrrсоеf([х у] ) . Примеры в приложении D.
1. 5 Вычисление матрицы ковариации
Приведенная далее функция позволяет вычислить матрицу ковариации для массива данных.
- cov(x) - возвращает смещенную дисперсию элементов вектора х. Для матрицы, где каждая строка рассматривается как наблюдение, а каждый столбец - как переменная, cov(x) возвращает матрицу ковариации.
- diag(cov(x» - вектор смещенных дисперсий для каждого столбца и sqrt(diag(cov(x) ) ) - вектор стандартных отклонений.
... продолжение- Информатика
- Банковское дело
- Оценка бизнеса
- Бухгалтерское дело
- Валеология
- География
- Геология, Геофизика, Геодезия
- Религия
- Общая история
- Журналистика
- Таможенное дело
- История Казахстана
- Финансы
- Законодательство и Право, Криминалистика
- Маркетинг
- Культурология
- Медицина
- Менеджмент
- Нефть, Газ
- Искуство, музыка
- Педагогика
- Психология
- Страхование
- Налоги
- Политология
- Сертификация, стандартизация
- Социология, Демография
- Статистика
- Туризм
- Физика
- Философия
- Химия
- Делопроизводсто
- Экология, Охрана природы, Природопользование
- Экономика
- Литература
- Биология
- Мясо, молочно, вино-водочные продукты
- Земельный кадастр, Недвижимость
- Математика, Геометрия
- Государственное управление
- Архивное дело
- Полиграфия
- Горное дело
- Языковедение, Филология
- Исторические личности
- Автоматизация, Техника
- Экономическая география
- Международные отношения
- ОБЖ (Основы безопасности жизнедеятельности), Защита труда