Форматы данных, используемые сайтом аналитики

Сайт экзаменационной аналитики используется в качестве базового формата - формат csv и xlsx.

Формат csv (comma separated values) - это текстовый файл, каждая строка которого соответствует строке таблицы, а данные каждой ячейки таблицы разделены знаком ;

Формат xlsx - это формат испольуемый последними версиями MS Excel и Google таблиц

  1. Формат файла-описателя таксономии предмета

Создайте в Excel или Google таблице иерархический список названий тематик, которые будут изучаться в ходе курса освоения предмета.

Пример описателя таксономии предмета
EC_Code Subject Weight Level
PI Введение, основные понятия 8 A
P1 Первая часть курса 32 B
P1.1 подраздел 1.1    
P1.2 подраздел 1.2    
P1.2.1 подраздел 1.2.1    
P1.2.2 подраздел 1.2.2    
P1.3 подраздел 1.3    
P2 Вторая часть курса 30 A
P3 Третья часть курса 30 C

где:

EC_Code:код таксономии, набор букв и цифр, если код разделяется точкой, значит это подуровень, допускается любое количество подуровней
EC_Subject:название тематики изучения
Weight:вес тематики в процентах, этот параметр используется для вычисления соответствия процента вопросов в экзамене по этой теме (необязательный параметр).
Level:сложность раздела, латинская буква от A (самый простой) до G (самый сложный) (необязательный параметр)

Note

Обратите внимание, что сумма цифр поля Weight для элементов 1-го уровня должна равняться 100%

Note

Сохраните полученную таблицу в формате *.csv

  1. Формат файла-дескриптора экзамена

Создайте в Excel или Google таблице файл и внесите в него данные дескриптора экзамена

Пример файла-дескриптора экзамена
NameQ Score EC_Code Right_Ans Ranges Formula Notes
Q1_1 5 P1.1        
Q1_2 1.5 P1.2 а      
Q1_3 3 P1.2.1 абв      
Q1_4 3 P1.2.2 а|б|в      
Q1_5 3 P1.2.3 а>б>в      
Q1_6 2.5 P1.3.1 10 9..11    
Q1_7 2 P1.3.1 121.2 121.1..121.3 =[Q1_3]*12  
Q1_8 2 P1.4 10.12.2013     Дата вступления в действие

где:

QName:код вопроса, он должен начинаться с буквы Q и иметь 2 и более числа, разделенных нижним подчеркиванием "_". Первое число - номер задания, второе и последующие - номера вопросов в задании
Score:балл за правильный ответ, может быть дробным, но не более 3 цифр после запятой, сумма баллов за все вопросы должна соответствовать введенной при создании шаблона
EC_Code:код элемента таксономии
RightAnswer:правильный ответ на вопрос, его значение определяет тип вопроса и может быть следующего вида:
  • пустое значение - в этом случае считается, в данных экзамена записан в виде ответа балл за вопрос в диапазоне 0..Score (например, при экспертной проверке вопроса)
  • латинской или кириллической буквой (допустимые значения "a,b,c,d,e,f,g,h,i,j,k,l" или "а,б,в,г,д,е,ж,з,и,й,к,л") - в этом случае вопрос будет иметь тип MCQ (выбор одного из вариантов), например: a.
  • латинскими или кириллическими буквами (допустимые значения "a,b,c,d,e,f,g,h,i,j,k,l" или "а,б,в,г,д,е,ж,з,и,й,к,л") без разделителя - тип вопроса "установить отношения", например: abc, порядковый номер буквы означает номер в первом списке.
  • латинскими или кириллическими буквами (допустимые значения "a,b,c,d,e,f,g,h,i,j,k,l" или "а,б,в,г,д,е,ж,з,и,й,к,л") разделенными знаком ">" - тип вопроса "установить последовательность", например: a>b>c.
  • латинскими или кириллическими буквами (допустимые значения "a,b,c,d,e,f,g,h,i,j,k,l" или "а,б,в,г,д,е,ж,з,и,й,к,л") разделенными знаком "|" - тип вопроса "N из M", например a|b|c.
  • целым или действительным числом (тогда вопрос может быть задачей, требующая ввода числа-решения, точность действительных чисел определяется количеством знаков после десятичной точки), например: 342 или 34.2.
  • датой (тогда вопрос требует в виде ответа ввода даты в формате дд.мм.гггг), например 01.12.2021.
Ranges:диапазоны правильных значений (только для числовых значений), используются, если нужно задать диапазон верных значений, допускается 1 или 2 диапазона, разделенных пробелом, например: 9..11 или 5..8 12..15
Formula:поле для записи формулы (только для числовых значений), если оно заполнено, что верным будет считаться не только числовой ответ, равный правильному ответу или диапазону, но и равный вычисленному по формуле значению

Note

Пример формулы: [Q1_2]=(4000*12)/[Q1_1]

Note

Чтобы избежать цикличной неоднозначности, формулы не должны содержать поля, с большим или равным номером следования, чем текущее поле, например для поля Q1_2 допускается в формуле только поле Q1_1 и не допускается Q1_2 (равный номер следования) или Q2_1 (больший номер следования).

Notes:поле для примечаний, которые будут использованы для формирования документа в формате pdf, содержащего скан работы и детальные объяснения для экзаменуемого ("детализации").
  1. Формат вариантов правильных ответов

Создайте в Excel или Google таблице файл и внесите в него данные вариантов правильных ответов

Пример файла с данными вариантов правильных ответов (для 3 вариантов) с циклической перестановкой как вопросов, так и ответов в каждом варианте
Q1 A1 Q2 A2 Q3 A3
Q1_1 A Q1_2 B Q1_3 C
Q1_1 B Q1_2 C Q1_3 D
Q1_1 C Q1_2 D Q1_3 A
Q1_1 D Q1_2 A Q1_3 B
Q1_2 A Q1_3 B Q1_1 C
Q1_2 B Q1_3 C Q1_1 D
Q1_2 C Q1_3 D Q1_1 A
Q1_2 D Q1_3 A Q1_1 B
Q1_3 A Q1_1 B Q1_2 C
Q1_3 B Q1_1 C Q1_2 D
Q1_3 C Q1_1 D Q1_2 A
Q1_3 D Q1_1 A Q1_2 B

Note

каждая строка - это запись соответствия вопроса в колонке Q1 и вопроса в колонке QN (где N - номер варианта). Также колонка с ответом A1 содержит соответствие каждого варианта в колонке AN.

Q1:Код вопроса из дескриптора экзамена
A1:Вариант ответа на вопрос Q1
QN:Код вопроса из дескриптора экзамена в варианте N который соответствует вопросу Q1
AN:Вариант ответа на вопрос QN соответствующий варианту ответа A1

Note

если значения полей Q1 и QN в одной строке - разные - это означает, что в варианте N экзамена выполнены перестановки вопросов. Так, например, в приведенной выше таблице в варианте 2 вопрос Q1_2 соответствует вопросу Q1_1 в варианте 1

Дополнительный пример показывает запись только ключей (правильных ответов) в том числе и числового правильного ответа с необязательным диапазоном

Пример 2 файла с данными вариантов правильных ответов (для 3 вариантов)
Q1 A1 Q2 A2 Q3 A3
Q1_1 A Q1_1 B Q1_1 C
Q1_2 ACD Q1_2 BAC Q1_2 CDA
Q1_3 10 Q1_3 18.2 Q1_3 12
Q1_4 10 [9.9..10.1] Q1_3 -1 [-1.1..-0.9] Q1_3 17.5 [17.49..17.51]

Note

в примере 2 показана возможность прямого указания правильных ответов варианта в том случае, если нет прямого соответствия между вариантами ответов (т.е., например, если текст ответа A вопроса Q1_2 варианта 1 никак не совпадает с текстом ответа B в вопросе Q1_3 варианта 2, но тем не менее является верным.

Note

для вопросов с числовым ответом пишется значение правильного ответа. Если нужно указать допустимый диапазон, он записывается в квадратных скобках (не обязательно)

  1. Формат данных экзаменационых работ

Создайте в Excel или Google таблице файл и внесите в него данные экзаменационных работ

Пример файла с данными экзаменационных работ
ID_Work GT Q1_1 Q1_2 Q1_3 Q1_4 Q1_5 Q1_6 Q1_7 Q1_8
AB1001X 18.0 1 а авг авг 123 12 170.10 11.11.2013
AB1002X 16.0 0 в гад гад 324 18 130.20 12.01.2013
AB1003X 15.0 2 а авд авг 431 3 121.40 10.11.2013

Note

каждая строка - это одна экзаменационная работа

ID_Work:код работы, допускаются любые буквенно-цифровые комбинации, не более 12 символов
GT:(не обязательно) балл за работу
QX_YY:ответы на вопросы, соответствующие дескриптору экзамена

допускаются следующие типы данных:

  • баллы, поставленные экспертом при проверке работы, значения от 0 до максимального балла за вопрос, допускаются дробные значение, но не более 3 цифр после десятичной точки
  • ответы MCQ (выбор одного из вариантов ответов), кириллические буквы от "а" до "л" или цифры от 1 до 9 или латинские буквы от "a" до "l", неответ кодируется как один из вариантов: "н", -1, "n", множественный ответ: "м", -2, "m"
  • числовые ответы
  • даты в формате "дд.мм.гггг"

Warning

Смешивание в кодированиии MCQ ответов не допускается. Это значит, что все данные могут кодироваться или буквами или цифрами