Задача: трансформация сырых данных.

Задача: трансформация сырых данных.

ЛЕКЦИЯ 1 10.02.2016

2-ая часть – Будем решать задачки. 1-ая часть – группа способов и процедуры.

Решение обычных задач по обработке обычных данных.

Задачка: специфицировать переменные.

СПСС: есть различные типы данных. Можем открывать ексель, текст, различные базы данных (Лотус, Дибейс и т.д.). Все файлы имеют расширение SAV (не находится в зависимости от Задача: трансформация сырых данных. версии). Файлы результатов в боле старенькых версиях не открываются в более новых.

В СППС есть два режима: режим визуализации «Данных» и режим визуализации «Переменных».

Данные всегда нужно приводить в порядок: описание спецификаций (что означают).

Спецификация переменной.

· Короткое заглавие (малогабаритное заглавие) и длинноватое (метка – полное развернутое заглавие).

Все наименования будут употребляться сходу в Задача: трансформация сырых данных. статьях, дипломе.

· Типы переменных: числовая, текстовая (пол, религия и т.д.).

Кодируем как текстовую, а желаем числовые операции.

· Шкала – принимаем решение сами. По какой шкале проведено измерение.

Шкалы зависят от типов и уровней отношений, которые они выражают. Нужно осознавать – какой уровень измерения я получу.

Неувязка: кодирую числом Задача: трансформация сырых данных., но забываю, что она значит. М – 1, Ж – 2. Что стоит за двойкой – ничего. В США помнят про сексизм. Когда высококачественные преобразуем в числа, мы должны осознать природу измерения. По школе наименований (номинативная) – если различные объекта различные числа, другими словами одно свойство – отличается одно од другого. Шкала систематизации.

Порядковая. Когда Задача: трансформация сырых данных. необходимо отношение – метод сравнить чего то, с чем то (во сколько раз, на сколько и т.д.). К примеру, шкала интроверсии – ставят стенки. Показывают и качество и порядок.

Наименования (номинальная) – высококачественные различия (одно отношение)

Интервалы (количественная)– децибелы, стенки, баллы. Устанавливаем как больше, как меньше. Мы вводим единицы измерения – средства Задача: трансформация сырых данных. измерения.

Шкала отношений. Вводится абсолютный ноль, тогда можем ввести дела во сколько раз.

В СПСС отношений и интервалов слиты (трудно обосновать абсолютный ноль). Говорим – количественные.

К примеру, возраст вступления в брак – дела. Можно сопоставить относительно нуля.

· Количество десятичных символов.

По дефлоту добавляется 2. Нам не необходимы для пола, родственников и Задача: трансформация сырых данных. т.д.

· Пропущенные значения.

Кто-то не пришел, утратили. Нужно сказать СПСС чтоб он пропустил эти данные, не включал. По другому нулевое, пропущенное значение попадет в расчеты. Чтоб избегать пустых, можно ставить значение, которого не может быть – 999.

Показываем, что конкретно это есть пропущенное значение. Если мы не отметили. СПСС поставит сам Задача: трансформация сырых данных. «.» и будет знать, что это значение пропущенное.

Итого режим работы с переменными значит, что мы должны обрисовать переменными, чтоб мы понимали, что они означают, чтоб СПСС осознавал как с ней работает.

Принципиально: Уровень измерений определяет способы анализа, определенный набор процедур.

Задачка: Как ввести данные.

Можно ввести создав Задача: трансформация сырых данных. перечень переменных, можно копировать из екселя и ворда, промежный экспорт в ексель, а позже в СПСС

Вкладка «Данные».

Файл-открыть-данные-расширение избираем и т.д. Принципиально чтоб переменные были подписаны, чтоб открытие было более корректным.

Результаты.

Можно открывать файлы с плодами: Вывод (графики, подписи).

Синтаксис.

Там фиксируются все команды, которые Задача: трансформация сырых данных. мы делаем – малогабаритный перечень строк, что мы делали (можно выслать по электрической почве и тому, кому отправили, может все повторить).

Скрипт.

Пишет программер (С.Бэсик, Перл). Подключаем и имеем свои статистические процедуры. Сами развиваем.

Задачка: трансформация сырых данных.

Данные-Преобразовать (избираем процедуры)

К примеру, сортировка наблюдений. Желаю отсортировать Задача: трансформация сырых данных. по значению некий переменной, убрать излишних из анализа (принципиально для огромных списков). Выбираю слева поля в окне фильтра.

Принципиально: по срокам испытуемые по колонкам переменные (если по-другому, то делаем транспонирование матрицы, в СПСС есть).

Отобрать наблюдения.

Смотрим по условию, ставим «Если выполнено условие». Вставляем в строчку условие. К примеру, пол=1. Ставим Задача: трансформация сырых данных. в Выводе: отфильтровать неотобранные наблюдения.

К примеру, отбираем юных. До 25 лет.

Слить файл.

Добавить новые методики, добавить от различных профессионалов которые собирают. Супервизор сливает как по горизонтали, так и по вертикале.

Верно представляем – наблюдение – по вертикале, переменные, по горизонтали.

Принципиально: если доливаем испытуемых, то непременно должно совпадать Задача: трансформация сырых данных. количественно переменных, наименования переменных. Потому сначала делается ШАБЛОН. Если сливаем по переменным, то набор испытуемых должен быть аналогичным. ФОРМАТ должен быть един.

Взвесить наблюдения.

Если данные весят по-разному (я студент, они эксперт, 3-ий супервизор). Тогда оценкам данным одним присваивают большее значение, каким-то наименьшее значение. В неких регрессионных моделях Задача: трансформация сырых данных. учитываются веса испытуемых.

Как делать: заводим вручную.


zadacha-obespechenie-dostojnogo-urovnya-vzaimodejstviya-s-zayavitelyami-17.html
zadacha-obrabotki-reshetki-stranica-2.html
zadacha-ocenka-dvuh-raspredelenij-i-ih-razlichiya-vliyanie-kakogo-to-faktora.html