Оценка диагностической валидности Стандартизированной методики исследования навыков чтения на русском языке и проверка актуальности имеющихся нормативных данных

Виктория Алексеевна Решетникова; Маргарита Никитична Серебрякова; Дария Николаевна Горанская; Татьяна Васильевна Ахутина; Ольга Викторовна Драгой

This article is published under a Creative Commons license and not by the author of the article. So if you find any inaccuracies, you can correct them by updating the article.

Update this article

Оценка диагностической валидности Стандартизированной методики исследования навыков чтения на русском языке и проверка актуальности имеющихся нормативных данных Creative Commons

Светлана Валентиновна Дорофеева,

Виктория Алексеевна Решетникова,

Маргарита Никитична Серебрякова,

Дария Николаевна Горанская,

Татьяна Васильевна Ахутина,

Ольга Викторовна Драгой

Российский журнал когнитивной науки, Journal Year: 2019, Volume and Issue: Том 6(1), P. 4 - 24

Published: March 20, 2019

Abstract

Стандартизированные тесты с нормативными данными стали золотым стандартом для оценки навыков чтения и для диагностики специфического расстройства чтения (дислексии) для многих языков. Для русского языка имеется такой тест для исследования чтения — Стандартизированная методика исследования навыков чтения, разработанная А. Н. Корневым и впервые опубликованная в 1997-м году. Однако наиболее свежие доступные нормативные данные по этой методике были собраны более десяти лет назад, и они не были проконтролированы по нескольким важным параметрам. Также не было опубликовано никаких деталей по поводу диагностической валидности теста. Мы использовали этот тест для оценки навыков чтения у девяноста типично развивающихся российских учеников начальной школы в 2018-м году. В данной статье мы представляем современные результаты тестирования типично развивающихся детей, включая обновленные уровни по скорости чтения и, впервые, метрики для оценки уровня понимания прочитанного и взвешенной оценки ошибок. Дополнительно мы протестировали пятьдесят детей с клинически диагностированной дислексией и сообщаем информацию о чувствительности и специфичности Стандартизированной методики исследования навыков чтения.

Keywords

Дислексия, СМИНЧ, Стандартизированная методика исследования навыков чтения, понимание прочитанного, русский язык, скорость чтения

Введение

Стандартизированные тесты необходимы для надежной и валидной количественной оценки способностей к чтению, а также для сравнения групп и отдельных лиц с целью диагностики нарушений чтения. Тесты на чтение с единым протоколом проведения и нормативными данными, полученными при тестировании большой выборки людей, стали методическим золотым стандартом в последние десятилетия. Комплексные тесты на чтение и письмо были разработаны для немецкого языка (Moll, Landeri, 2010; Wimmer, Mayringer, 2014), стандартизированный тест на чтение слов (Brus, Voeten, 1973) и стандартизированный тест на чтение псевдослов (van den Bos et al., 1994) были разработаны для голландского языка. Для английского языка доступно несколько вариантов стандартизированных инструментов для оценки чтения, включая специализированные батареи тестов на чтение (Torgesen et al., 1999; Wechsler, 1990; Woodcock, 1999) и субтесты на чтение в составе комплексных инструментов когнитивной оценки, таких как Wide Range Achievement Test (Wilkinson, Robertson, 2006). Стандартизированный тест на чтение доступен и для русского языка.

Стандартизированная методика исследования навыков чтения (СМИНЧ) для русскоязычных детей была разработана в 1982 году, впервые опубликована в 1997 году (Корнев, 1997) и переиздана в 2003 году (Корнев, 2003). Второй раунд сбора нормативных данных был проведен в 2007-2008 годах (Корнев, Ишимова, 2010), чтобы отразить изменения в средней производительности чтения у детей, которые происходят с течением времени. Эта методика, согласно утверждению автора, предназначена для «диагностики нарушений чтения и дифференциальной диагностики дислексии и неспецифических нарушений чтения» (Корнев, Ишимова, 2010, с.7). Другие существующие для русского языка инструменты оценки чтения являются составной частью протоколов комплексного нейропсихологического обследования (Ахутина и др., 2016; Семенович, 2002), но их диагностическое применение ограничено из-за отсутствия опубликованных нормативных данных.

СМИНЧ имеет ряд очевидных преимуществ. Во- первых, во время рестандартизации количество детей, протестированных для сбора нормативных данных, было значительно увеличено. Первое издание (Корнев, 1997) было опубликовано с нормативными данными, полученными в результате тестирования 150 школьников. Текущее издание (Корнев, Ишимова, 2010) было опубликовано с нормативными данными, полученными в результате тестирования 700 школьников. Во-вторых, этот тест на чтение дает возможность измерить не только скорость чтения, но и уровень понимания прочитанного, для этого используются вопросы о содержании прочитанного с четкими рекомендациями для оценки правильности ответов. В-третьих, он включает в себя тексты различной сложности (простой текст I и более сложный текст II), что позволяет проводить сравнительный анализ результатов тестируемого в зависимости от сложности текста. Корнев и Ишимова (2010, с. 13) сообщают, что разница в 10 и более баллов между показателями чтения двух текстов указывает на большую выраженность нарушений чтения. Наконец, СМИНЧ включает дополнительные тексты, предназначенные для повторного тестирования при необходимости, с уровнями сложности, сопоставимыми с первыми двумя текстами, а также с нормативными данными 400 московских школьников, протестированных в 2009-2010 гг.

Тем не менее СМИНЧ в ее нынешнем виде имеет ограничения. Случайно выбранные дети из государственных школ принимали участие в тестировании для сбора нормативных данных (Корнев, Ишимо- ва, 2010), хотя для определения надлежащих уровней нормативной производительности предпочтительно включать в исследование только детей без диагностированных неврологических расстройств или умственной отсталости (Ivanova, Hallowell, 2013). Кроме того, несмотря на наличие вопросов о содержании прочитанного для оценки уровня понимания и хорошо разработанные критерии для подсчета ответов как правильных или неправильных, авторы не опубликовали нормативные данные для понимания прочитанного. Они предложили рассматривать как «функционально достаточный» такой уровень производительности, при котором дети дают как минимум 7 верных ответов на 10 вопросов. В то же время они предоставили информацию о распределении протестированных в 2007-2008 годах 700 московских школьников по уровням понимания прочитанного. Из этих данных авторов методики можно рассчитать, что 53 % и 69 % второклассников правильно ответили менее чем на 7 вопросов к тексту I и тексту II соответственно (Корнев, Ишимова, 2010, с. 49). Таким образом, предложенная рекомендация не может служить руководством для диагностики расстройства понимания прочитанного. Для оценки понимания прочитанного требуются нормативные баллы, аналогичные таковым для оценки скорости чтения.

Что еще более важно для диагностических целей, в последнем издании СМИНЧ (Корнев, Ишимова, 2010) прямые нормативные данные, например средняя скорость чтения и стандартное отклонение, не были представлены. Вместо этого авторы предложили преобразование по специальной формуле, в результате чего были получены коэффициенты техники чтения (см. раздел «Метод»). Эти коэффициенты были представлены не для каждого возможного числа правильно прочитанных слов, но с пропусками в три пункта. В результате, когда производительность конкретного ребенка находится на границе (например, между «группой риска» и «дислексией»), нет однозначного ответа, к какой группе следует отнести результат. Наконец, Корнев (2003, с. 213) утверждал, что «апробация на клиническом материале показала достаточную валидность методики», но при этом психометрические свойства СМИНЧ не были представлены (например, размер выборки, чувствительность и специфичность теста). В результате диагностика дислексии у русскоязычных детей на основе этого теста остается сложной задачей для клинической практики.

Мы провели исследование, направленное на преодоление некоторых текущих ограничений СМИНЧ и улучшение возможностей ее клинического применения. Во-первых, для проверки актуальности имеющихся нормативных данных мы собрали новые данные по СМИНЧ, протестировав типично развивающихся российских школьников, у которых не было диагностированных неврологических нарушений, с измеренным ненарушенным невербальным интеллектом и нормальным слухом, а также с нормальным или скоррек-

Таблица 1. Общая информация о типично развивающихся участниках исследования

N=90	Первоклассники		Второклассники		Третьеклассники		Четвероклассники
N=90	Девочки	Мальчики	Девочки	Мальчики	Девочки	Мальчики	Девочки	Мальчики
Всего	12	6	15	12	13	13	8	11
(М/В)	(12/0)	(6/0)	(11/4)	(7/5)	(7/6)	(5/8)	(1/7)	(1/10)

Примечание. (М/В) — количество участников, протестированных в Москве / в Волгограде.

тированным до нормального зрением. В отличие от авторов СМИНЧ, которые предусмотрели нормы для 2-6-го классов российской школьной системы, мы также протестировали детей 1-го класса (во второй половине учебного года), чтобы можно было идентифицировать детей с нарушениями чтения или с риском развития нарушений чтения как можно раньше. В результате мы сообщаем новые прямые данные (средние значения и стандартные отклонения) по скорости чтения и пониманию прочитанного у типично развивающихся российских школьников для каждого из классов начальной школы.

Кроме того, мы оценили валидность СМИНЧ для диагностики дислексии. Для этого мы протестировали 50 детей, у которых была клинически диагностирована дислексия, и проанализировали соответствие между клиническим диагнозом и показателями этих детей по СМИНЧ, используя оригинальные нормы, приведенные в последнем опубликованном руководстве к тесту (Корнев, Ишимова, 2010), и наши новые данные.

Метод

Участники

Типично развивающиеся участники были набраны в трех российских государственных школах, две из которых находятся в Москве (и = 58) и одна в Волгограде (и = 47). Все дети (всего N=105) были носителями русского языка в возрасте от 7 до 11 лет и были учениками начальной школы с первого по четвертый классы. У детей не было истории диагностированных неврологических расстройств, не было диагностированных проблем с освоением чтения, все имели нормальное или скорректированное до нормального зрение (как сообщается в информированных согласиях, данных их родителями или законными представителями). Скрининг на первичные нарушения слуха (с использованием программы Audiogramm версии 4.6.1.3, профессиональной аудиометрической системы; ауди- ометрических наушников Sennheiser HDA 280) привел к исключению трех участников. Скрининг на уровень невербального интеллекта с помощью цветных прогрессивных матриц Равена (Равен, 2004; Равен и др.,
2012) привел к исключению 12 участников, набравших баллы ниже нормы. Девяносто детей (48 девочек; 50 детей из Москвы; 7 левшей; Af_age = 8.7, SD= 1.13) остались в анализе. Общая информация о типично развивающихся участниках, включенных в анализ, представлена в таблице 1.

Прежде чем использовать результаты тестирования детей из разных городов в общем анализе, мы проанализировали влияние эффекта города на показатели чтения с учетом класса и пола участников. Для этого мы использовали линейные регрессионные модели, которые были построены при помощи пакета Іте4 для программы статистической обработки данных R (Bates et al., 2015). В модель в качестве предикторов для скорости чтения были включены такие факторы, как город, класс и пол протестированных детей. Статистически значимого эффекта влияния фактора город на скорость чтения обнаружено не было (Est=6.681, $£=3.94, t=1.69, Pr(> 11|) = .094). В аналогичную модель в качестве предикторов для количества правильных ответов на вопросы были также включены такие факторы, как город, класс и пол протестированных детей. Статистически значимого эффекта влияния фактора город на уровень понимания прочитанного также не было обнаружено (Est=-0.873, $£ = 0.575, t=-1.52, Pr(>|t|) = .133).

Все участники с дислексией (N=50, девочек 17; 1 левша; Af_age=8.9, SD= 1.2) были носителями русского языка. Они были учащимися начальной школы, с первого по четвертый классы, и, основываясь на клинической оценке, имели устные языковые навыки, типичные для их возраста. Критерием включения было подтверждение наличия дислексии клиническими специалистами Центра патологии речи и нейрореабилитации (Москва) непосредственно перед исследованием. Для этого сертифицированным логопедом и нейропсихологом детского отделения проводилось исследование речи и других высших психических функций. Стоит отметить, что для отбора в исследование приглашались дети, чьи родители по собственной инициативе обращались в Центр патологии речи и нейрореабилитации. Эти родители сообщали о стойких трудностях у их детей с освоением чтения, с которыми они пытались справиться как самостоятельно, так и с помощью школьных или частных логопедов (этот параметр варьирует), но стойкого достаточного эффекта не получали.

Согласно данным проведенного нейропсихологического обследования (Ахутина и др., 2016), дети были разнородны по типам имеющихся дефицитов при дислексии. У части протестированных детей отмечались трудности с обработкой зрительной и зрительно-пространственной информации, у части детей наблюдалось снижение навыков фонематической обработки, слухоречевой памяти, восприятия ритмов, у некоторых из детей была отмечена быстрая утомляемость от деятельности, связанной с восприятием письменного текста. В ряде случаев можно было отметить комбинацию двух или более дефицитов с разной степенью выраженности. Качество письма у детей варьировало от близкого к норме (при переписывании текста с образца) до почти полностью отсутствующего письма. Также критериями включения были нормальное или скорректированное до нормального зрение, нормальный слух, нормальный невербальный интеллект (измеренные теми же инструментами, что и в группе типично развивающихся детей) и отсутствие истории неврологических нарушений.

Письменные формы информированного согласия были подписаны родителями или законными представителями детей; дети также устно согласились участвовать. Исследование было одобрено Комиссией по внутриуниверситетским опросам и этической оценке эмпирических исследовательских проектов Национального исследовательского университета «Высшая школа экономики» (Россия) (протокол №47 от 08.05.2018).

Материалы и процедура

Скорость чтения и понимание прочитанного у детей были оценены с помощью СМИНЧ (Корнев, Ишимова, 2010). Для первичного тестирования авторами методики рекомендовано использовать первые половины текстов I и II (по три абзаца из каждого текста). «При повторных исследованиях можно предлагать ребенку чтение второй половины текстов I или II или использовать дополнительные тексты, приведенные в приложении 2» (Корнев, Ишимова, 2010, с. 11). Для каждой половины текста предусмотрены свои 10 вопросов на понимание прочитанного. Мы использовали первые половины текстов I и II («Как я ловил раков» и «Неблагодарная ель») и вопросы к ним.

Первый текст (3 абзаца, 97 слов) был проще; второй текст (3 абзаца, 127 слов) был более сложным, по утверждению авторов методики (Корнев, Ишимова, 2010, с. 13). Для количественной оценки уровня сложности текста I и текста II мы проанализировали слова, входящие в их состав, с точки зрения частотности (в количествах вхождений на миллион, ірш) и длины (в слогах и в буквах). Мы использовали информацию о частотности слов из Лингвистической базы данных для слов русского языка StimulStat Project (Alexeeva et al., 2017). При подсчете мы учитывали все полнозначные слова (по леммам). Слова, встречающиеся в тексте несколько раз, учитывались по количеству вхождений. Результаты анализа подтвердили, что текст I содержит более высокочастотные слова, а в тексте II использованы слова большей длины (см. таблицу 2).

Все дети до начала чтения были предупреждены, что после прочтения каждого текста им нужно будет отвечать на вопросы к тексту. Среди принявших уча
стие в нашем исследовании типично развивающихся детей не было ни одного первоклассника, который не смог бы прочитать предложенные тексты. Учитывая, что СМИНЧ — единственная стандартизированная методика для оценки навыков чтения на русском языке и что она широко используется логопедами, мы не можем строго утверждать, что все дети видели данные тексты впервые. Однако никто из детей, участвующих в тестировании, не сообщал после чтения о том, что этот текст он уже читал. Данные тексты не использовались для проверки навыков чтения при отборе детей с дислексией для нашего исследования.

В соответствии с оригинальной процедурой дети должны были читать тексты вслух и сразу после прочтения каждого из текстов ответить на десять вопросов к содержанию прочитанного. Подавляющее большинство детей не успевали прочитать больше трех абзацев за одну минуту. Если ребенок читал медленно, мы не останавливали его, пока он не закончит читать третий абзац — то есть фрагмент, достаточный для ответов на все вопросы. Если ребенок читал быстро, мы не прерывали его в момент окончания чтения третьего абзаца, а ждали, пока пройдет одна минута с того момента, когда он закончил читать название текста, и только потом останавливали, чтобы иметь возможность посчитать количество правильно прочитанных за одну минуту слов.

Согласно оригинальным рекомендациям, тестирующий должен слушать, как ребенок читает, и контролировать параметры чтения, используя форму с текстом и количеством слов, напечатанных в конце каждой строки. Однако некоторых детей это отвлекало, и мы фиксировали аудиозаписи, пока дети читали. Эти записи были в дальнейшем проанализированы в автономном режиме.

Скорость чтения измерялась как количество слов, прочитанных верно за первую минуту (общее количество прочитанных слов минус количество ошибочно прочитанных слов (Корнев, Ишимова, 2010, с. 12)). Понимание прочитанного оценивалось как количество правильных ответов на вопросы. Когда участник не мог прочитать второй текст совсем (10 детей с дислексией), мы считали скорость чтения равной 0, уровень понимания прочитанного равным 0, а количество неправильно прочитанных слов было помечено как NA (нет данных).

Для диагностических целей авторы (Корнев, 2003; Корнев, Ишимова, 2010) предложили преобразовать исходные данные по скорости чтения в коэффициент техники чтения (КТЧ) по следующей формуле:

КТЧ = 100 + ((М - ш) / ш) * 50,

где М — количество слов, правильно прочитанных ребенком за первую минуту, т — среднее количество слов, правильно прочитываемых за одну минуту детьми того же класса. Соответствие между скоростью чтения и КТЧ для конкретного класса было представлено в таблице КТЧ (Корнев, Ишимова, 2010, с. 46-47). В качестве аргумента в пользу преобразования прямых данных о скорости чтения детей в коэффициенты КТЧ авторы СМИНЧ отмечали возможность приведения данных к стандартной шкале, совпадающей по размерности со шкалой IQ при использовании адаптированного варианта методики Д. Векслера ABM-WISC (Панасюк, 1973). Это должно было обеспечить удобство сравнения результатов детей, протестированных с помощью СМИНЧ и ABM-WISC. Однако в настоящее время тест Д. Векслера для русскоязычных детей имеет ограничения для применения в качестве метода психометрии (Базыльчик, 2016). Сравнение результатов теста на чтение с результатами тестов на интеллект чрезвычайно важно для выявления детей с дислексией, но необходимо использовать методики с актуальными нормативными данными. С учетом того, что нормативные данные могут устаревать, а рестандартизация тестов может проходить с разной скоростью, на наш взгляд, целесообразно приводить нормативные данные по чтению с указанием выборочных средних и стандартных отклонений, чтобы у исследователей и практиков была возможность выбирать наилучший из доступных в конкретный момент времени тестов на интеллект. Мы в нашем исследовании использовали тест Дж. Равена, поскольку к нему есть более актуальные нормы для русскоязычных детей, которые приведены в официальном руководстве (Равен и др., 2012) и которые собраны с участием русскоговорящих младших школьников (Давыдов, Чмыхова, 2016).

Авторами СМИНЧ было рекомендовано рассматривать показатели в пределах от одного стандартного отклонения до полутора стандартных отклонений ниже среднего уровня скорости чтения для определенного класса как непатологические формы задержки чтения, которые предположительно могут быть преодолены педагогическими средствами. В свою очередь, скорость чтения более чем на полтора стандартных отклонения ниже средней должна рассматриваться как принадлежащая к спектру дислексии. Значения от одного до полутора стандартных отклонений будут сигнализировать о риске дислексии. Мы использовали вышеупомянутые рекомендации для оценки валидности СМИНЧ (Корнев, Ишимова, 2010).

Поскольку для русского языка отсутствуют другие стандартизированные тесты на чтение, было невозможно оценить тот вид критериальной валидности, которая рассчитывается как коэффициент корреляции между баллами по изучаемому тесту и внешней мерой — результатами аналогичных тестов, признанных «золотым стандартом» (Ivanova, Hallowell, 2013). Поэтому мы использовали такой вид критериальной валидности, как валидность по одновременности (конкурентная валидность), которая рассчитывается посредством сравнения с другим критерием — наличием или отсутствием клинического диагноза дислексии у ребенка, принимающего участие в исследовании. Мы проанализировали данные 90 типично развивающихся детей и 50 детей с клиническим диагнозом «дислексия». Мы оценили такие психометрические свойства СМИНЧ, как чувствительность (процент детей с клинически диагностированной дислексией, которые показали результаты ниже контрольного уровня и которым был бы поставлен диагноз «дислексия» при использовании СМИНЧ), а также специфичность (процент участников без дислексии, которые показали результаты в пределах нормы и которые были бы диа
гностированы как типично развивающиеся — на основе СМИНЧ; Ivanova & Hallowell, 2013). Кроме того, мы изучили соответствие между клиническим диагнозом и показателями этих детей по СМИНЧ, используя наши новые данные о типично развивающихся детях.

Результаты

Скорость чтения

В таблице 3 представлена средняя скорость чтения типично развивающихся детей от 1-го до 4-го класса. Для сравнения мы представляем данные, опубликованные автором СМИНЧ в 1997 году (данные, переизданные в 2003 году, были такими же, как и в 1997 году). Руководство, опубликованное в 2010 году, не содержало информации о средних и стандартных отклонениях для скорости чтения, но представляло результаты преобразования по формуле КТЧ исходных норм (см. раздел «Метод»). Поэтому мы взяли формулу КТЧ Корнева (2003) и на основе таблицы КТЧ из публикации Корнева и Ишимовой (2010, с.46-47) вычислили средние значения скорости чтения для учеников 2-4-го классов, которые должны были быть использованы для получения таких КТЧ.

Таблица 3. Средняя скорость чтения

	Средняя скорость чтения (Корнев, 1997, 2003)		Рассчитанная средняя скорость чтения из КТЧ (Корнев, Ишимова, 2010)		Средняя скорость чтения, по нашим новым данным
Класс	Текст 1	Текст II	Текст I	Текст II	Текст I	Текст II
1	NA	NA	NA	NA	43.3	31.2
2	52.2	41.7	62.5	52.0	70.3	55.1
3	101.4	89.5	84.7	72.5	90.4	75
4	96.1	98.5	106.4	92.6	94.5	95.4

Примечание. NA — данные отсутствовали.

Авторы методических рекомендаций к СМИНЧ (Корнев, Ишимова, 2010) предложили рассматривать как непатологические формы задержки чтения результаты по скорости чтения на одно стандартное отклонение ниже среднего уровня для соответствующего класса, а как принадлежащие к спектру дислексии рассматривать результаты ниже чем на полтора стандартных отклонения по сравнению со средним значением для соответствующего класса (см. раздел «Метод»). Мы использовали те же уровни отсечки для наших новых данных. Было невозможно надежно реконструировать стандартные отклонения для выборки Корнева и Ишимовой (2010 г.), поскольку авторы не предоставили исходные индивидуальные данные в открытых источниках. Поэтому мы представляем сравнение средней скорости чтения и стандартных отклонений между нашими нормативными данными и данными, опубликованными Корневым (1997, те же данные в 2003) в таблице 4. В таблице 5 мы представляем контрольные уровни для оценки скорости чтения на основе наших нормативных данных: значения для нормы, группы риска и дислексии.

Понимание прочитанного

Вторым важным критерием оценки навыков чтения является уровень понимания прочитанного. С этой целью автор СМИНЧ предложил 10 вопросов о содержании к каждому из текстов. Было рекомендовано оценивать результаты по четырем уровням: А — 10 правильных ответов на 10 вопросов, В — 7-9 правильных ответов, С — 4-6 правильных ответов и D — 3 или менее правильных ответов. Уровни А и В рекомендуется рассматривать как «функционально достаточные», то есть позволяющие использовать полную информацию, содержащуюся в тексте. Тем не менее средние данные о количестве правильных ответов на вопросы к текстам в группе типично развивающихся детей никогда не публиковались Корневым и Ишимовой, поэтому мы не можем сравнивать результаты понимания прочитанного на основе наших данных с их результатами.

В таблице 6 мы представляем контрольные уровни для оценки понимания прочитанного на основе показателей 90 типично развивающихся детей протестированной нами группы: значения для группы нормы, группы риска и дислексии. Эти данные показывают, что даже в четвертом классе типично развивающиеся дети с нормальным уровнем развития невербального интеллекта дают в среднем около 5 правильных ответов на 10 вопросов для текста II (младшие дети дают еще меньше правильных ответов). Таким образом, первоначальный критерий, рекомендованный в методическом пособии к СМИНЧ (Корнев, Ишимова, 2010), то есть 7-10 правильных ответов, вряд ли может служить основой для диагностики нарушений понимания прочитанного.

Валидность СМИНЧ

Как описано в разделе «Метод», мы исследовали валидность СМИНЧ (Корнев, Ишимова, 2010) для диагностики дислексии, рассчитав такие психометрические свойства теста, как чувствительность и специфичность, используя оригинальные нормы, приведенные в последнем опубликованном методическом пособии
к тесту (Корнев, Ишимова, 2010), и наши новые данные для группы типично развивающихся детей.

Специфичность

Чтобы оценить специфичность теста, мы проанализировали, какой процент типично развивающихся детей попал бы в группу нормы на основе СМИНЧ (Корнев, Ишимова, 2010). Поскольку нормативные данные по СМИНЧ опубликованы только для второго и последующих классов, мы не имели возможности оценить результаты 18 первоклассников из нашей выборки. Среди 72 детей, учащихся 2-4-го классов, из нашей группы типично развивающихся школьников не было ни одного ребенка, у которого КТЧ попадал бы в группу дислексии (то есть ниже уровня в 1.5 стандартных отклонения) согласно данным таблицы КТЧ, опубликованной в пособии Корнева и Ишимовой (2010). У 69 детей значения КТЧ были в пределах 1 стандартного отклонения (типичное чтение), а у трех детей (один ребенок четвертого класса и два второклассника) — между 1 и 1.5 стандартного отклонения (группа риска). Согласно этим результатам, ни у одного ребенка не была бы ошибочно диагностирована дислексия, а специфичность СМИНЧ может быть оценена как 100%.
Стоит отметить, что в отсутствие скрининга невербального интеллекта, зрения и слуха неспецифические нарушения чтения могут быть ошибочно отнесены к дислексии, в то время как проблема может быть вызвана другим сопутствующим нарушением (Snowling, Nash, Gooch, Hayiou-Thomas, & Hulme, 2019). В нашей первоначальной когорте было 15 детей (позже исключенных из анализа) без диагноза дислексии, но с зарегистрированными нарушениями слуха или с результатами ниже нормы в тесте на уровень невербального интеллекта (Равен и др., 2012). В случае, если бы мы не проверяли их по этим критериям исключения, четверо детей (двое детей по результатам чтения обоих текстов и двое других детей по результатам чтения второго текста) могли бы быть ошибочно отнесены к группе дислексии на основе их значений КТЧ, что снизило бы показатели специфичности теста.
Мы проверили, насколько изменилась бы специфичность теста при использовании диагностических критериев, основанных на наших новых данных. Из 90 детей, учащихся 1 -4-го классов, из нашей группы типично развивающихся школьников показатели по скорости чтения у пяти детей (два второклассника, один ребенок из третьего класса и два ребенка из четвертого класса) оказались ниже уровня в 1.5 стандартных отклонения от среднего. То есть эти дети попали бы в группу дислексии, что снизило бы специфичность теста со 100 % до 94.4 %.

Чувствительность

Чтобы оценить чувствительность теста, мы проанализировали, какой процент детей с клинически диагностированной дислексией попал бы в группу дислексии на основе СМИНЧ (Корнев, Ишимова, 2010). Девять первоклассников не могли быть оценены, так как нормативные данные по СМИНЧ были опубликованы только начиная со второго класса. В таблице 7 представлено процентное распределение оставшихся детей 2-4-го классов (и = 41) по группам с типичным чтением, риском развития дислексии и с дислексией на основе КТЧ для текста I и текста II.

Таблица 7. Распределение детей с клинически диагностированной дислексией по группам на основе СМИНЧ и норм Корнева и Ишимовой (2010) (Л/=41, 2-4-й классы)

N=41	Скорость чтения в пределах нормы, %	Группа риска, %	Дислексия, %
Текст I	51.2	12.2	36.6
Текст II	43.9	17.1	39.0

Таким образом, согласно результатам чтения текста I, 15 детей из 41 (2-4-й классы) с клинически диагностированной дислексией были бы классифицированы как имеющие дислексию при использовании нормативных данных, опубликованных в 2010 году. Это дает чувствительность теста 36.6%. Согласно результатам чтения текста II, 16 детей были бы классифицированы как имеющие дислексию, что соответствует чувствительности теста, равной 39.0 %.

Мы проверили, как ситуация изменилась бы, если бы мы использовали уровни отсечки в соответствии с нашими новыми данными, полученными в 2018 году (они приведены в таблице 5). В таблице 8 представлено процентное распределение всех протестированных детей с клинически диагностированной дислексией по группам на основе результатов в тесте на чтение СМИНЧ и согласно новым данным для текста I и текста II.

С новыми уровнями отсечки по скорости чтения текста I 34 из 50 детей с клинически диагностированной дислексией были бы классифицированы как имеющие диагноз «дислексия» при использовании наших новых данных. Это дает чувствительность теста 72.0 %. Согласно скорости чтения текста II, 30 из 50 детей с диагнозом дислексия были бы классифицированы как имеющие диагноз «дислексия», что соответствует чувствительности теста, равной 60.0 %.

Мы также проверили, изменилось ли бы значение чувствительности СМИНЧ, если, помимо скорости чтения, оценивалось бы понимание прочитанного. Мы использовали те же самые диагностические уровни отсечки, которые были предложены в оригинальном руководстве для скорости чтения: одно стандартное отклонение от среднего значения для результатов, оцениваемых как группа риска, и полтора стандартных отклонения для результатов, относимых к дислексии. Мы использовали только наши новые данные (см. таблицу 6), поскольку авторы СМИНЧ не публиковали нормативные данные для понимания прочитанного. В протестированной нами когорте все участники с нарушением понимания прочитанного имели также нарушение скорости чтения, при этом было 13 детей с пониманием прочитанного в пределах нормы, но с нарушениями скорости чтения. В таблице 9 представлено процентное распределение всех протестированных детей с клинически диагностированной дислексией по группам на основе показателей в тесте СМИНЧ на уровень понимания прочитанного и в соответствии с нашими данными для текста I и текста II.

Среди 50 детей с клинически диагностированной дислексией 10 показали результаты ниже отсечки на уровне 1.5 стандартных отклонения, отвечая на вопросы к тексту I. Эти дети были бы диагностированы как имеющие дислексию, если бы в качестве диагностического критерия использовались только показатели понимания прочитанного. Это дает чувствительность теста 20%. 19 детей показали результаты ниже этого уровня отсечки, отвечая на вопросы к тексту II, что соответствует чувствительности теста, равной 38 %.

В поисках объяснения, почему у 14 детей (28 % из всех протестированных детей с дислексией), которые находились в пределах нормативного диапазона по скорости чтения и уровню понимания прочитанного на основе СМИНЧ, была клинически диагностирована дислексия, мы выполнили дополнительный анализ. Для этого мы переслушали аудиозаписи того, как дети читали, и подсчитали взвешенные баллы за ошибки, используя систему штрафных баллов. Корнев и Ишимова (2010, с. 9) утверждали, что «ошибки, которые допускают дети с дислексией, качественно не отличаются от ошибок, которые в норме наблюдаются у начинающих овладевать чтением». В нашей выборке дети допускали ошибки разного уровня: от незначительных, таких как повторение одного звука или ослабление звука в слабой позиции, до серьезных, таких как произнесение другого слова вместо представленного или потеря строки и дезориентация. В таблице 10 представлены типы ошибок, которые
совершали как дети из группы нормы, так и дети из группы с дислексией, а также система штрафных баллов за эти ошибки.

Таблица 10. Система штрафных баллов за ошибки разного типа

Штрафные баллы
Типы ошибок	Без само- коррекции	С само- коррекцией
Неверное ударение в слове	1	0.5
Пропуск, замена или добавление одного звука	1	0.5
Перестановка местами 2-3 звуков	2	1
Пропуск, добавление или изменение 2-3 звуков	2	1
Пропуск одного слова	2	1
Повтор одного слова	2	1
Добавление одного служебного слова	2	1
Добавление одного полнозначного слова	3	1.5
Замена одного слова (замена 4 или более звуков в одном слове)	3	1.5
Потеря строки и дезориентация	3	1.5

ниваемых как группа риска, и полтора стандартных отклонения для результатов, относимых к дислексии. Мы использовали наши данные по 50 протестированным детям с дислексией для текста I, но по 40 протестированным детям с дислексией для текста II, поскольку 10 детей с дислексией (20% участников с дислексией) текст II не смогли прочитать совсем, и данные об ошибках во втором тексте для них отсутствуют. В таблице 12 представлено процентное распределение всех протестированных детей с клинически диагностированной дислексией по группам на основе взвешенной оценки ошибок в тесте СМИНЧ в соответствии с нашими данными для текстов I и II.

Для каждого ребенка мы рассчитали итоговый взвешенный балл за ошибки, суммируя штрафные баллы за каждую допущенную ошибку. Результаты 90 типично развивающихся детей представлены в таблице 11. Затем мы подсчитали штрафные баллы за ошибки для каждого из тех 14 детей с клинически диагностированной дислексией, у которых не был выявлен дефицит чтения по основным показателям СМИНЧ. Мы обнаружили, что для всех этих детей штрафные баллы по крайней мере для одного из текстов были более чем на 1.5 стандартных отклонения выше, чем средние значения для соответствующего класса. Другими словами, эти дети читают бегло, но с большим количеством ошибок большего веса. Таким образом, они имеют нарушение качества чтения, а не скорости, что остается незамеченным при использовании оригинальных критериев оценки СМИНЧ (Корнев, Ишимова, 2010).

Мы проверили, изменилось ли бы значение чувствительности СМИНЧ, если, помимо скорости чтения, оценивалось бы качество чтения с учетом нового критерия — взвешенных баллов за ошибки. Мы использовали те же самые диагностические уровни отсечки, которые были предложены в оригинальном руководстве для скорости чтения: одно стандартное отклонение от среднего значения для результатов, оце

Таблица 12. Распределение детей с клинически диагностированной дислексией по группам на основе взвешенной оценки ошибок в тесте СМИНЧ (в соответствии с нашими данными, 1 -4-й классы)

	Взвешенные баллы за ошибки в пределах нормы, %	Группа риска, %	Дислексия, %
Текст I (Л/=50)	30.0	6.0	64.0
Текст II (Л/=40)	7.5	15.0	77.5

Среди 50 детей с клинически диагностированной дислексией 32 показали результаты ниже отсечки на уровне 1.5 стандартных отклонения при чтении текста I. Эти дети были бы диагностированы как имеющие дислексию, если бы в качестве диагностического критерия использовались только взвешенные баллы за ошибки при чтении. Это дает чувствительность теста 64%. Среди 40 детей с дислексией, сумевших прочитать второй текст, 31 ребенок показал результаты ниже уровня отсечки, что соответствует чувствительности теста, равной 77.5 %.

Заключение

Стандартизированные тесты для диагностических целей должны использоваться с актуальными нормативными данными, поскольку нормативные показатели могут изменяться со временем (Raven, 2000). Тот факт, что нормативные данные необходимо обновлять, касается не только данной конкретной методологии, но и является характерным для большинства стандартизированных тестов. В методическом пособии, опубликованном в 2010 году (Корнев, Ишимова, 2010), авторы также отмечали целесообразность обновления нормативных данных. Важно отметить, что для получения надлежащих уровней отсечки для определения нормативных показателей предпочтительнее тестировать не случайно выбранных детей, а тех, которые соответствуют таким критериям включения, как нормальные интеллектуальные способности, зрение и слух, а также отсутствие диагностированных неврологических расстройств (Ivanova, Hallowell, 2013).

Данные, которые мы собрали для СМИНЧ в 2018 году, обеспечивают обновленные уровни для оценки показателей чтения и проконтролированы с учетом упомянутых критериев включения в тестируемую нормативную выборку. Хотя количество участвовавших в нашем исследовании типично развивающихся детей (N=90) недостаточно для полной рестандартизации теста, тот факт, что нормы, рассчитанные на выборке в 90 человек, оказались в диагностическом плане продуктивнее норм из авторского руководства (Корнев, Ишимова, 2010) для выявления клинического феномена, говорит о том, что нормы необходимо пересматривать.

Что касается диагностической силы СМИНЧ, специфичность теста является превосходной, это означает, что любой нормативный набор данных СМИНЧ позволяет идентифицировать типичные показатели чтения и отсутствие дислексии в новой когорте тестируемых с высокой точностью: от 100% (при использовании нормативных данных, полученных в 2007-2008 годах) до 94.4 % (при использовании контрольных уровней, рассчитанных на данных 2018 года). Однако чувствительность СМИНЧ существенно зависит от нормативных данных, используемых для расчета уровней отсечки. При использовании нормативных данных, полученных в 2007-2008 годах, чувствительность теста находилась между 36.6 % и 39.0 % (в зависимости от текста), а при использовании наших новых данных по скорости чтения, полученных в 2018 году, чувствительность теста достигала 60.0-72.0%. Чувствительность теста даже 72.0% означает, что 28.0% детей с нарушениями чтения могут быть ошибочно не диагностированы как таковые. Как было показано во многих исследованиях, следствием непризнания дислексии является отсутствие адекватного вмешательства, приводящее к тревоге и депрессивному поведению (Mugnaini et al., 2009; Willcutt, Pennington, 2000; Nelson, Harwood, 2011; Törö et al., 2018), суицидальным мыслям, неудачам в школе и отсеву из школы (ВагЬіего et al., 2019; Daniel et al., 2006; Wilson et al., 2009).

Относительно низкая чувствительность СМИНЧ является результатом использования только одного (хотя и самого важного) диагностического критерия — скорости декодирования. Однако инструмент, разработанный Корневым и Ишимовой, фактически позволяет использовать два дополнительных диагностических критерия: уровень понимания прочитанного и взвешенную оценку ошибок, допущенных при чтении. Мы предоставляем контрольные уровни для оценки понимания прочитанного и взвешенной оценки ошибок, основанные на результатах протестированной нами когорты типично развивающихся детей, для дальнейшего улучшения клинической валидности СМИНЧ.

Наше исследование показало, что введение в качестве дополнительного диагностического критерия взвешенной оценки ошибок может улучшить диагностические возможности СМИНЧ. Подсчет штрафных баллов за ошибки оказался возможен благодаря изменению процедуры тестирования (аудиозаписи того, как читают дети). Учитывая, что это нововведение и решает проблему отвлечения детей, и позволяет более точно оценить параметры чтения, можно рекомендовать включить в процедуру диагностики аудиозапись чтения.

Что касается оценки понимания прочитанного (которая в СМИНЧ осуществляется с помощью вопросов о содержании, на которые дети отвечают после прочтения текстов), то результаты этих тестов довольно вариативны, но в целом достаточно низки даже у нормы. Это приводит к тому, что как нарушение диагностируются только крайне низкие уровни понимания прочитанного (см. таблицу 6, а также комментарии на с. 16 в авторском руководстве Корнева и Ишимовой, 2010). Актуальные данные показывают, что применение критерия «понимание прочитанного» не позволяет повысить общую чувствительность теста. Это говорит либо о том, что данный тест может быть полезен только в специфических случаях, когда у ребенка при нормальной скорости и точности чтения отмечается очень низкий уровень понимания прочитанного (в нашей выборке таких детей не встретилось), либо о том, что диагностическая ценность данного задания сомнительна. Однако поскольку понимание прочитанного является чрезвычайно важным для школьного обучения в целом, в будущих исследованиях, возможно, стоит рассмотреть варианты более эффективных тестов на понимание прочитанного.

Важно, что три вышеупомянутых дефицита (медленное чтение, недостаточное понимание прочитанного и многочисленные серьезные ошибки при чтении), измеряемые с помощью метрик СМИНЧ (скорость чтения, уровень понимания и взвешенная оценка ошибок соответственно), могут наблюдаться у детей с дислексией как по отдельности, так и в сочетании. Вопрос о том, следует ли для диагностики дислексии рассматривать один или несколько критериев, является предметом соглашения и будущих исследований. Наше исследование показало, что дети с только одним типом дефицита — с высокой скоростью чтения и нормальным пониманием прочитанного, но с большим количеством ошибок — были всё же клинически диагностированы как имеющие дислексию.

Мы предлагаем использовать не один критерий, а два или лучше три критерия для диагностических целей: скорость чтения, понимание прочитанного и взвешенная оценка ошибок, поскольку ни один из критериев
отдельно не обеспечивает близкую к 100 % чувствительность теста (см. раздел «Результаты»), Контрольные уровни для их оценки представлены в таблице 5, таблице 6 и таблице 11 соответственно. Если показатели ребенка на полтора стандартных отклонения ниже, чем среднее значение для того же класса, необходимо диагностировать дислексию. Кроме того, скрининг невербальных интеллектуальных способностей, слуха и зрения должен обязательно сопровождать тестирование навыков чтения, поскольку эти параметры связаны с чтением — и при оценке навыков чтения их необходимо учитывать. Стоит отметить, что западными исследователями при диагностике нарушений чтения используются также тесты на чтение слов (аналогичный, например, Brus, Voeten, 1973) и на чтение псевдослов (аналогичный, например, van den Bos et al., 1994). Разработка подобных стандартизированных инструментов для русского языка и проверка их эффективности при диагностике дислексии — одна из задач будущих исследований.

В заключение мы выражаем глубокую признательность А.Н. Корневу и О. А. Ишимовой за создание единственной доступной стандартизированной методики исследования навыков чтения у русскоязычных детей. Мы надеемся, что наши новые данные, клиническая экспертиза и предлагаемые поправки к подсчету результатов (касающиеся более точной оценки понимания прочитанного и введения взвешенной оценки ошибок) дополнят усилия авторов методики и будут способствовать еще более широкому использованию СМИНЧ.

Литература

АхутинаТ.В., Корнеев А. А., Матвеева Е. Ю., Романова А. А., Агрис А. Р., Полонская Н. Н., Пылаева Н.М., Воронова М.Н., Максименко М. Ю., Яблокова Л. В., Меликян 3. А., Кузева О. В. Методы нейропсихологического обследования детей 6-9 лет / Под ред. Т.В. Акутиной. М.: В. Секачев, 2016.

Базыльчик С. В. Пригодность русифицированных версий детского теста Векслера (WISC) для диагностики умственной отсталости // Психиатрия, психотерапия и клиническая психология. 2016. № 2. С. 12-20. URL: https://elibrary. ruZi.tem^asp?id=2614Q28Z.

Давыдов Д. Г., Чмыхова Е. В. Применение теста Стандартные прогрессивные матрицы Равена в режиме ограничения времени // Вопросы психологии. 2016. №4. С. 129-139.

КорневА.Н. Нарушения чтения и письма у детей. Учебно-методическое пособие. СПб.: МиМ, 1997.

КорневА.Н. Нарушения чтения и письма у детей. Учебно-методическое пособие. СПб.: Речь, 2003.

Корнев А. Н, ИшимоваО.А. Методика диагностики дислексии у детей. Методическое пособие. СПб.: Издательство Политехнического университета, 2010.

Панасюк А.Ю. Адаптированный вариант методики Д. Векслера WISC. М.: Медицина, 1973.

Равен Д. Цветные прогрессивные матрицы серии А, Ab, В. М.: Когито-Центр, 2004.

Равен Д., Равен Д. К, Корт Д. Руководство к Прогрессивным Матрицам Равена и Словарным Шкалам. Раздел 3. Стандартные Прогрессивные Матрицы (включая Паралель- ные и Плюс версии). М.: Когито-Центр, 2012.

Семенович А. В. Нейропсихологическая диагностика и коррекция в детском возрасте. М.: Академия, 2002.

Alexeeva S., Slioussar 'N., Chernova D. StimulStat: A lexical database for Russian // Behavior Research Methods. 2018. Vol. 50. No.6. P.2305-2315. doi:10.3758/sl3428-017-0994-3

Barbiero C., Montico M., Lonciari L, Monasta L., Penge R., Vio C., .... Ronfani L. on behalf of the EpiDIt (Epidemiology of Dyslexia in Italy) working group. The lost children: The underdiagnosis of dyslexia in Italy. A cross-sectional national study 11 PLoS One. 2019. Vol. 14. No. 1. P.e0210448. doi:10.1371/journal. pone.0210448

Bates D., Mächler M., BolkerB., Walker S. Fitting linear mixed-effects models using lme411 Journal of Statistical Software. 2015. Vol. 67. No. 1. P. 1-48. doi:10.18637/jss.v067.i01

van den BosK.P., Spelberg H. C. L., Scheepstra A.J.M., DeVries J. R. De Klepel. VormAenB. Eentestvoordeleesvaar- digheidvanpseudowoorden. Verantwoording, handleiding, diag- nostiekenbehandeling [The Clapper. Form A and B. A test for reading the pseudowords. Accountability, manual, diagnostics treatment], Nijmegen, the Netherlands: Berkhout, 1994.

BrusB.T., Voeten M. J. Een-minuut-test vorm A en B. Verantwoording en handleiding [One-minute word reading test version A and B. Justification and manual], Nijmegen, the Netherlands: Berkhout, 1973.

Daniel S. S., Walsh A. K., Goldston D. B., Arnold E. M., Reboussin B.A., Wood F. B. Suicidality, school dropout, and reading problems among adolescents 11 Journal of Learning Disabilities. 2006. Vol.39. No. 6. P.507-514. doi:10.1177/0022219406039 0060301

Ivanova M. V, Hallowell B. A tutorial on aphasia test development in any language: Key substantive and psychometric considerations// Aphasiology. 2013. Vol. 27. No. 8. P. 891-920. doi:10 .1080/02687038.2013.805728

Moll K., Landerl K. SLRT-II: Lese- und Rechtschreibtest [Reading and Spelling Test]. Bern: Hans Huber, 2010.

Mugnaini D, Lassi S., La Malfa G., Albertini G. Internalizing correlates of dyslexia 11 World Journal of Pediatrics. 2009. Vol. 5. No.4. P.255-264. doi:10.1007/sl2519-009-0049-7

Nelson J.M., Harwood H. Learning disabilities and anxiety: A meta-analysis // Journal of Learning Disabilities. 2011. Vol. 44. No. l.P.3-17. doi: 10.1177/0022219409359939

Raven J. The Raven's progressive matrices: Change and stability over culture and time // Cognitive Psychology. 2000. Vol. 41. No. 1. P. 1 -48. doi: 10.1006/cogp. 1999.0735

SnowlingM.J., NashHM., Gooch DC., Hayiou- Thomas M. E., Hulme C., Wellcome Language and Reading Project Team. Developmental outcomes for children at high risk of dyslexia and children with developmental language disorder 11 Child Development. 2019. Vol. 90. No. 5. P.e548-e564. doi:10.11U/ cdev.13216

Torgesen J. K., Wagner R. K., Rashotte C. A. Test of word reading efficiency (TOWRE). Austin, TX: PRO-ED, 1999.

Того К. T, Miklosi M., Horanyi E., Kovacs G. P, Balazs J. Reading disability spectrum: Early and late recognition, subthreshold, and full comorbidity // Journal of Learning Disabilities. 2018. Vol.51. No.2. P. 158-167. doi:10.U77/0022219417704169

Wechsler D. Wechsler objective reading dimensions. London: The Psychological Corporation, 1990.

Wilkinson G. S., Robertson G. J. Wide Range Achievement Test 4 professional manual. Lutz, FL: Psychological Assessment Resources, 2006.

Willcutt E. G., Pennington B. F. Psychiatric Comorbidity in Children and Adolescents with Reading Disability 11 Journal of Child Psychology and Psychiatry. 2000. Vol. 41. No. 8. P. 1039-1048. doi:10.1017/S0021963099006368

Wilson A. M., Deri Armstrong C, FurrieA., WalcotE. The mental health of Canadians with self-reported learning disabilities 11 Journal of Learning Disabilities. 2009. Vol. 42. No. 1. P. 24-40. doi: 10.1177/0022219408326216

Wimmer H, Mayringer H. SLS 2-9: Salzburger Lese-Screen- ing fur die Schulstufen 2-9 [Salzburg Reading and Spelling Test]. Bern: Hans Huber, 2014.

Woodcock R. Woodcock Reading Mastery Test-Revised. Circle Pines, MN: American Guidance Services, 1999.