интересно
Предыдущая | Содержание | Следующая

Кодирование

Процедура кодирования (coding) заключается в присваивании кода, обычно цифрового, каждому возможному варианту ответа по каждому вопросу.

Код включает указание на положение столбцов (полей) и информации, которая в них содержится. Так, пол респондентов может кодироваться следующим образом: 1 для женщин и — для мужчин. Поле отображает единичный элемент данных, например пол респондента. Запись состоит из ряда соответствующих полей: пол, семейное положение, возраст, состав семьи, занятие респондента и т.д. Все демографические и личностные характеристики респондента, как правило, содержатся в одной регистрационной записи. Обычно каждая запись состоит из 80 столбцов, хотя это и не обязательное условие. На одного респондента можно завести несколько записей.

Данные (т.е. все записи) по всем респондентам хранятся в компьютерном файле, пример которого вы видите в табл. 14.1. Столбцы представляют собой поля, а строки — записи. В табл. 14.1 представлены фрагменты закодированных данных по респондентам, опрошенным в ходе реализации уже привычного нам проекта "Выбор универмага".

Все данные соответствуют схеме кодирования, изображенной на рис. 14.2.

Столбцы [—3 представляют собой одно поле, и в них указаны номера респондентов, закодированные номерами от 001 до 271, Столбец 4 содержит номер записи. В нем проставлено значение 1 для всех строк, поскольку в нашем примере отображается только первая запись по.всем респондентам. В столбцах 5 и 6 содержится код проекта, 31. В столбцах 7 и 8 указывается код интервьюера от 01 до 55, поскольку в данном опросе задействовано 55 интервьюеров. Колонки 26—35, каждая из которых представляет определенное поле, содержат рейтинговую оценку (от 1 до 6 j степени ознакомления респондентов с 10 универмагами, вошедшими в исследование. И наконец, столбец 77 отображает рейтинговую оценку цен универмага №10. Обратите внимание, что столбцы 78 и 80 не заполнены. По каждому респондент) представлено 10 записей. Количество строк составляет 2710, что указывает на то, что в данном файле содержится информация, полученная от 271 респондента.

Если анкета включает только структурированные вопросы или очень незначительное количество неструктурированных вопросов, она кодируется заранее. Это означает, что коды присваиваются, прежде чем начинается непосредственная полевая работа. Если же в анкете содержатся в основном неструктурированные вопросы, коды присваиваются уже после того, как заполненные анкеты возвращаются с места сбора данных (так называемое посткодирование). Предварительное кодирование кратко обсуждалось в главе 10, посвященной описанию структуры анкет. Ниже вашему вниманию представлены дальнейшие основные рекомендации по этой процедуре.

Кодирование вопросов

Код респондента и номер записи необходимо указывать для каждой записи данных. Следует также включать дополнительные коды для каждого респондента: код проекта, код интервьюера, код даты и времени, проверочный код. Настоятельно рекомендуется также использовать фиксированные коды полей (fixed field code), в которых номер записей по каждому респонденту одинаков, и в одних и тех же колонках по всем респондентам указываются одни и те жеданные.

Если это возможно, по всем пропущенным данным следует использовать стандартные коды. Так, переменную, указываемую в одном столбце, можно закодировать №9; для переменной, указываемой в двух столбцах, назначить код 99 и т.д. Следует помнить, что коды пропущенных, значений должны отличаться от кодов, присвоенных ответам, полученным надлежащим способом в ходе опроса.

Кодирование структурированных вопросов — относительно простая процедура, поскольку в этом случае варианты ответов определяются заранее. Исследователь присваивает каждому возможному варианту ответа код и указывает соответствующую запись и столбец, в который эти коды будут введены. Например:

1. Действителен ли на сегодня ваш паспорт? Да        2. Нет     (2/54)

Ответ "Да" на этот вопрос закодирован кодом 1, а ответ "Нет" — кодом 2. Числа в скобках говорят о том, что данный присвоенный код указывается во второй записи по данному респонденту в столбце 54. Поскольку вопрос предусматривает только один ответ и на выбор предложено всего два варианта (I или 2), одного столбца достаточно. Как правило, одного столбца бывает достаточно для кодирования любого структурированного вопроса, предполагающего один вариант ответа, если на выбор предлагается меньше девяти вариантов ответов.

Если же существует большое количество вариантов ответов, для каждого возможного варианта следует выделить отдельный столбец. К таким вопросам относятся, например, вопросы об использовании торговой марки, о читательских и зрительских предпочтениях респондентов и т.д. Например:

Вопрос: Какие счета вы имеете в данном банке?(Пометитькрестиком все варианты ответа)

Обычный сберегательный счет

Обычный текущий счет

Ипотечный

Счет НАУ

Клубный счет (рождественский и т.д.)

Кредитнаялиния

Срочный сберегательный счет (срочные депозиты и т.д.)

Страхование жизни в сберегательном банке

Заем на усовершенствование жилища

Заем на приобретение автомобиля

Другие услуги

Для примера представим, что респондент помечает обычный сберегательный, текущий и срочный сберегательный счета. Таким образом, в записи №9 в столбцах 62, 63 и 68 введен код 1. Во всех остальных столбцах (64, 65, 66, 67, 69, 70, 71 и 72) проставляется код 0.

Кодирование неструктурированных вопросов или вопросов, допускающих несколько вариантов ответа, представляет более сложную задачу. Сначала ответы респондентов дословно записываются в анкету. Затем для них разрабатываются коды, которые и присваиваются конкретным ответам. Иногда, основываясь на предыдущих проектах или на теоретических предпосылках, маркетолог может разработать коды еще до начала работы по сбору данных. Однако обычно к этой процедуре приступают только тогда, когда получены заполненные анкеты. После этого исследователь составляет список, включающий 50-100 наиболее частых вариантов ответов на неструктурированные вопросы, и определяет категории, подлежащие кодированию. После того как коды разработаны, необходимо подготовить кодировщика, который будет присваивать записанным в словарной форме ответам соответствующие коды. Обычно при кодировании неструктурированных вопросов и анкет вообще рекомендуется выполнять следующие правила.

Коды категорий должны быть взаимоисключающими и вэаимоисчерпываюшими. Категории считаются взаимоисключающими, если каждому ответу присваивается только один код. Категории не должны перекрывать одна другую. Категории считаются взаимоисчерпывающими, если каждый ответ соответствует одному из кодов, присвоенных данной категории. Этого можно достичь введением дополнительного кода категории, например "другое" или "ни один из предложенных вариантов". Однако следует помнить, что в эту категорию должна войти только незначительная часть ответов (не больше 10%). Подавляющая часть ответов должна относиться к значимым категориям.

По наиболее важным вопросам коды категорий должны присваиваться даже в том случае, если они не упоминались ни одним из респондентов. Иногда важно знать именно то, что никто из отвечающих не дал тот или иной вариант ответа. Представим, например, что руководство одной крупной компании, выпускающей потребительские товары, решило выяснить, нравится ли потребителям упаковка новой марки мыла. С этой целью при кодировании вариантов ответов на вопрос "Что вам больше всего не нравится в этой марке мыла?" была включена отдельная категория "упаковка". Данные кодируются для того, чтобы сохранить как можно больше деталей ответов. Например, собрав данные о частоте перелетов, совершаемых бизнесменами с использованием конкретных коммерческих авиалиний, необходимо закодировать ее подробно, а не просто сгруппировать по двум кодам категорий — "летаю часто" и "летаю нечасто". Эти данные по частоте перелетов позволят исследователю впоследствии разграничить категории бизнесменов-путешественников несколькими разными способами. Если же категории определены заранее, последующий анализ данных ограничится только этими категориями.