Антиплагиат индекс читаемости сложный что значит. Индекс читабельности: формула и предназначение. Общий вывод по уровням: читаемость средняя

  • Индекс удобочитаемости Флеша
  • Примечания

Индекс удобочитаемости Флеша

Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка . Она оценивает сложность текста по следующей формуле

F R E = 206,835 − 1,015 total words total sentences − 84 , 6 total syllables total words , {\displaystyle FRE=206{,}835-1{,}015{\frac {\text{total words}}{\text{total sentences}}}-84{,}6{\frac {\text{total syllables}}{\text{total words}}},}

FRE = 206,835 − 1,015 × ASL − 84,6 × ASW,

ASL - средняя длина предложения в словах ( англ. average sentence length ), ASW - средняя длина слова в слогах ( англ. average number of syllables per word ) . FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.

Подробности Создано: 12.04.2014 20:02 Обновлено: 10.03.2019 18:32 Опубликовано: 12.04.2014 20:02

В последнее время многие студенты столкнулись с проблемой о которой хотелось бы сегодня поговорить. Проблема эта связанна с проверкой работ на уникальность в самом распространенном в России сервисе проверки студенческих работ – сайте antiplagiat.ru.

В настоящее время сайт antiplagiat.ru внес ряд дополнений после которых некоторые документы отображаются в системе проверки как «Подозрительный документ». Вроде и процент уникальности может быть высокий, но файл светится красным и возле названия работы отображается восклицательный знак который и сигнализирует по мнению авторов данного новшества преподавателю что с документом что-то не так.

Если нажать на значек "Подозрительный документ" то откроется информация о документе в которой можно увидеть причину того почему сайт распознает документ подозрительным, по факту их четыре:

Причин связанных с этим на самом деле может быть очень много, но разве преподаватель будет заморачиваться и разбираться какая именно у Вас причина появления данного значка.

Вот что нам ответили создатели данного ресурса:

«Появление данного знака говорит о том, что нужно более внимательно отнестись к данному документу. Возможно, были попытки обхода системы. Возможно в тексте присутствует слишком много иностранных слов, либо слов, где превышена средняя длина слова. Такое возможно в работах, где используется много терминов (работы по химии, юриспруденции, например). В отчете ВУЗа есть текстовые статистики, на основе которых и появляется этот знак (индекс читаемости, максимальная длина слова и пр.). Появление данного знака и выделение документа всего лишь дает сигнал преподавателю более внимательно отнестись к данному тексту. Однако не факт, что работа действительно сделана так, чтобы обойти систему. Отбор работ проводится на основании определённых показателей-индикаторов в текстовых статистиках, которые можно увидеть, открыв отчет в ВУЗе. Однако все эти индикаторы не дают точного «приказа» забраковать этот текст. Они просто дают повод преподавателю более внимательно и серьезно отнестись к проверке данной работы. Если преподаватель этого не знает, он может написать нам письмо и мы ему об этом расскажем. Преподаватель не должен ориентироваться только на проценты и появление данного знака, он также должен открывать отчет и просматривать его».

Вот что пишут недовольные данным новшеством люди:

Давайте теперь попытаемся разобраться с чем это может быть связанно и как с этим бороться, как убрать этот «Подозрительный знак» и сделать наш файл обычным.

Чаще всего это бывает из-за того что в тексте встречаются длинные, сложные или иностранные слова, например, "социометриия", "либерализированный", GlobalFinance и прочие, которые не распознает автоматическая проверка орфографии.

Все слова которые ворд подчеркивает красным, типа с ошибкой. Как показывает практика так же это и все слова которые длиннее 10 букв, в общем все очень длинные слова нам и нужно будет менять на синонимы или разделять на 2-3 слова для того чтобы в конце наш текст стал понятным программе проверки и он перестал выделяться «Подозрительным документом».

Итак подведем итог, что нам делать чтобы файл стал нормальным и прошел проверку.

Индекс удобочитаемости - мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.

Индекс удобочитаемости Флеша

Наиболее популярная мера была создана Рудольфом Флешем , изначально для английского языка . Она оценивает сложность текста по следующей формуле

F R E = 206,835 − 1,015 total words total sentences − 84 , 6 total syllables total words , {\displaystyle FRE=206{,}835-1{,}015{\frac {\text{total words}}{\text{total sentences}}}-84{,}6{\frac {\text{total syllables}}{\text{total words}}},}

FRE = 206,835 − 1,015 × ASL − 84,6 × ASW,

ASL - средняя длина предложения в словах (англ. average sentence length ), ASW - средняя длина слова в слогах (англ. average number of syllables per word ) . FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.

Индекс туманности Ганнинга или Фог-индекс (Fog Index) показывает уровень удобочитаемости текста.

Этот метод проверки комфорта восприятия текста назван по имени создателя Роберта Ганнинга. Вначале он предназначался для журналистов, чтобы избежать туманных формулировок в написанном. В настоящее время используется копирайтерами для определения степени простоты текста для читателей.

Индекс Ганнинга рассчитывается по формуле:

Fi = (Nws + Nwt) * 0,4
Nws - количество слов в предложении.
Nwt - количество слов в одном предложении длиной 3 и более слогов.


Исходная формула туманности Ганнинга:

Для текстов на русском языке применяется поправочный коэффициент 0,78.
Число сложных слов — слова с числом слогов больше четырёх.

Расчет определяет с точностью до класса образования, насколько читатель готов к пониманию написанного.

Приняты следующие значения Fog Index:

70 и выше - не требуется специальной подготовки;
- до 70 - среднее образование;
- до 60 - интеллектуальный уровень подготовки;
- до 30 - для понимания нужен научный уровень подготовки.

Проверив текст по данному методу на удобочитаемость, вы определите, не труден ли он для восприятия, не перегружен ли терминами, т.к. простота текста - значимый фактор его успеха. Нужно писать грамотно, со смыслом, но не забывать о «дружелюбности» к читателю.

Рассчитывается индекс так:

  • Вычленяется фрагмент текста от 100 до 200 слов.
  • Подсчитывается количество слов в предложениях. Как одно слово считаем числа и даты. Сложносочинённые предложения делим на 2 части.
  • Численность слов делим на численность предложений и получаем среднюю длину последних.
  • Учитываем число слов с 3-мя и более слогами (кроме составных слов, имён собственных, глаголов, усложнённых склонением, падежом, временем).
  • Число многосложных слов делим на общую численность слов. Получаем процент многосложных слов в фрагменте текста.
  • К полученной цифре прибавляем средний показатель длины предложения.
  • Это значение умножаем на 0,4.

Индекс удобочитаемости - мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.

Индекс удобочитаемости Флеша

Наиболее популярная мера была создана Рудольфом Флешем , изначально для английского языка . Она оценивает сложность текста по следующей формуле

F R E = 206,835 − 1,015 total words total sentences − 84 , 6 total syllables total words , {\displaystyle FRE=206{,}835-1{,}015{\frac {\text{total words}}{\text{total sentences}}}-84{,}6{\frac {\text{total syllables}}{\text{total words}}},}

FRE = 206,835 − 1,015 × ASL − 84,6 × ASW,

ASL - средняя длина предложения в словах (англ. average sentence length ), ASW - средняя длина слова в слогах (англ. average number of syllables per word ) . FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.

Поделиться