Индексът за четливост срещу плагиатство е сложен, което означава. Индекс на четимост: формула и предназначение. Общо заключение по нива: четивността е средна

Flush Readability Index
Бележки

Flush Readability Index

Най-популярната мярка е създадена от Рудолф Флеш, първоначално за английски. Той оценява сложността на текста по следната формула

F R E = 206.835 − 1.015 общо думи общо изречения − 84 , общо 6 срички общо думи , (\displaystyle FRE=206(,)835-1(,)015(\frac (\text(total words))(\text(total изречения)))-84(,)6(\frac (\текст(общо срички))(\текст(общо думи))),)

FRE = 206.835 - 1.015 * ASL - 84.6 * ASW,

ASL - средна дължина на изречението в думи (англ. средна дължина на изречението), ASW - средна дължина на думата в срички (англ. среден брой срички на дума) . FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

Като цяло, повечето методи за оценка на сложността на текст, базирани на индекси за четливост за информационни и аналитични документи на руски език, дават оценки, които надхвърлят интерпретируемия диапазон от стойности и извън референтните стойности. В същото време получените резултати се характеризират с висока степен на корелация, тъй като разработчиците използват един математически модел на линейна регресия, както и единни текстови параметри (средна дължина на думата, средна дължина на изречението). В същото време индексите за четливост не са адаптирани към тестове за възрастни. Професионалистът не би трябвало да има затруднения с разбирането на многосрични думи. В крайна сметка факторите на сложността са семантиката на текста и абстрактността на неговото представяне. Индикаторите, базирани на индекси за четливост, не се тълкуват добре, тъй като не могат да се използват директно за прогнозиране на времето за обработка на текст от конкретно лице.

Подробности Създаден: 04/12/2014 20:02 Актуализиран: 03/10/2019 18:32 Публикуван: 04/12/2014 20:02

Напоследък много студенти се сблъскаха с проблем, за който бих искал да говоря днес. Този проблем е свързан с проверката на документи за уникалност в най-разпространената услуга за проверка на студентски работи в Русия - сайтът antiplagiat.ru.

В момента сайтът antiplagiat.ru направи редица допълнения, след което някои документи се показват в системата за проверка като „Подозрителен документ“. Изглежда, че процентът на уникалност може да бъде висок, но файлът свети в червено и до заглавието на работата се показва удивителен знак, което според авторите на това нововъведение сигнализира на учителя, че нещо не е наред с документа .

Ако кликнете върху иконата "Подозрителен документ", ще се отвори информация за документа, в която можете да видите причината, поради която сайтът разпознава документа като подозрителен, всъщност те са четири:

Всъщност може да има много причини, свързани с това, но дали учителят ще се потруди и ще разбере каква точно е вашата причина за появата на тази икона.

Ето какво ни казаха създателите на този ресурс:

„Появата на този знак показва, че е необходимо да се обърне повече внимание на този документ. Може би е имало опити за заобикаляне на системата. Може би в текста има твърде много чужди думи или думи, при които средната дължина на думата е надвишена. Това е възможно в произведения, в които се използват много термини (работи по химия, юриспруденция, например). Докладът на университета съдържа текстова статистика, въз основа на която се появява този знак (индекс на четимост, максимална дължина на думата и др.). Появата на този знак и изборът на документа само дава сигнал на учителя да обърне повече внимание на този текст. Не е факт обаче, че работата наистина се извършва по такъв начин, че да се заобиколи системата. Подборът на произведения се извършва на базата на определени индикаторни показатели в текстовата статистика, които могат да се видят чрез отваряне на справка в университета. Всички тези показатели обаче не дават точна „заповед” за отхвърляне на този текст. Те просто дават повод на учителя да бъде по-внимателен и сериозен към проверката на тази работа. Ако учителят не знае това, той може да ни напише писмо и ние ще му кажем за това. Учителят не трябва да се ръководи само от процентите и външния вид на този знак, той също трябва да отвори отчета и да го види.”

Ето какво пишат хората, които са недоволни от това нововъведение:

Нека сега се опитаме да разберем с какво може да е свързано това и как да се справим с него, как да премахнем този „Подозрителен знак“ и да направим нашия файл нормален.

Най-често това се дължи на факта, че текстът съдържа дълги, сложни или чужди думи, например "социометрия", "либерализиран", GlobalFinance и други, които автоматичната проверка на правописа не разпознава.

Всички думи, които Думата подчертава в червено, са с правописни грешки. Както показва практиката, това са и всички думи, които са по-дълги от 10 букви, като цяло ще трябва да променим всички много дълги думи в синоними или да ги разделим на 2-3 думи, така че в края нашият текст да стане разбираем за проверка програма и тя престава да се откроява " подозрителен документ.

Така че нека обобщим какво трябва да направим, за да направим файла нормален и да преминем теста.

Индекс на четимост- мярка за сложността на възприемането на текста от читателя. Индекс на четимостможе да се изчисли въз основа на няколко параметъра: дължината на изреченията, думите, конкретният брой на най-честите (или редки) думи и др.

Flush Readability Index

FRE = 206.835 - 1.015 * ASL - 84.6 * ASW,

ASL - средна дължина на изречението в думи (англ. average sentence length), ASW - средна дължина на думата в срички (англ. среден брой срички на дума) . FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

Индекс на мъглявината Гънинг или Индекс на мъглата (Индекс на мъглата)показва нивото на четимост на текста.

Този метод за тестване на удобството при четене на текст е кръстен на своя създател Робърт Гънинг. Първоначално беше предвидено журналистите да избягват неясни формулировки в написаното. В момента се използва от копирайтъри, за да се определи колко лесен е даден текст за читателите.

Индексът на Gunning се изчислява по формулата:

Fi = (Nws + Nwt) * 0,4
Nws е броят на думите в изречението.
Nwt - броят на думите в едно изречение от 3 или повече срички.

Оригиналната формула за мъглявината Гънинг е:

За текстове на руски език се прилага корекционен коефициент 0,78.
Броят на сложните думи са думи с повече от четири срички.

Изчислението определя, до степента на образование, доколко читателят е готов да разбере написаното.

Приемат се следните стойности на индекса на мъгла:

70 и повече - не се изисква специално обучение;
- до 70 - средно образование;
- до 60 - интелектуално ниво на подготовка;
- до 30 - за разбиране е необходимо научно ниво на обучение.

Проверявайки текста за четливост с помощта на този метод, ще определите дали е труден за разбиране, дали е претоварен с термини, т.к. простотата на текста е важен фактор за неговия успех. Трябва да пишете компетентно, със смисъл, но не забравяйте за „приятелството“ към читателя.

Индексът се изчислява по следния начин:

Отделен е фрагмент от текст от 100 до 200 думи.
Броят на думите в изреченията се брои. Броим числата и датите като една дума. Сложните изречения са разделени на 2 части.
Разделяме броя на думите на броя на изреченията и получаваме средната дължина на последните.
Вземаме предвид броя на думите с 3 или повече срички (с изключение на сложни думи, собствени имена, глаголи, усложнени по склонение, падеж, време).
Броят на многосричните думи се разделя на общия брой думи. Получаваме процента на многосричните думи в текстов фрагмент.
Добавяме средната дължина на изречението към получената цифра.
Тази стойност се умножава по 0,4.

Flush Readability Index

FRE = 206.835 - 1.015 * ASL - 84.6 * ASW,