Zipf мыйзамынын текстин анализдөө деген эмне

Мазмуну:

Zipf мыйзамынын текстин анализдөө деген эмне
Zipf мыйзамынын текстин анализдөө деген эмне

Video: Zipf мыйзамынын текстин анализдөө деген эмне

Video: Zipf мыйзамынын текстин анализдөө деген эмне
Video: Текст боюнча машыгуу иштери, текстти кайталоо 2024, Апрель
Anonim

Издөө тутумдары жыл сайын акылдуу болуп баратат. Эгерде жакынкы убакка чейин алар ачкыч сөздөрдүн тыгыздыгын жана актуалдуулуктун бир аз солкулдаган көрсөткүчүн гана эске алышса, азыр макаланын жогору жагына өтүшүнүн эң маанилүү шарттарынын бири тексттин табигый мүнөзү болуп калды. Аны Zipf мыйзамына ылайык анализдин жардамы менен баалоого болот.

Zipf мыйзамынын текстин анализдөө деген эмне
Zipf мыйзамынын текстин анализдөө деген эмне

Zipf мыйзамы боюнча текст кандайча талданат?

Издөө тутумунун механизмдери жасалма жол менен түзүлгөн текст табигый эмес деп табылып, издөө натыйжаларынын алдыңкы орундарынан четтетилет. Тексттин табигый деңгээлин кантип аныктоого болот? Америкалык лингвист Джордж Зипф тексттин табигый мыйзамын чыгарды, ага ылайык, текстте сөздүн колдонулуш жыштыгы анын иреттик санына тескери пропорционалдуу. Башкача айтканда, экинчи сөз биринчисинен жарым эсе көп, үчүнчүсү биринчисинен үч эсе сейрек кездешет ж.б.

Ушул жөнөкөй математикалык методго таянып, каалаган текстти табигый нерсе боюнча талдай аласыз. Ушул эрежеге 30-50 пайызга туура келген текст табигый нерсе деп эсептелет. Пайыз канчалык жогору болсо, текст ошончолук табигый көрүнөт. Интернетте буга чейин Zipf мыйзамына ылайык текстти талдоо үчүн колдонула турган атайын онлайн ресурстар бар. Индекси 30 пайыздан төмөн болгон макалалар издөө тутумдары тарабынан четке кагылат.

Zipf боюнча тексттин анализинин натыйжаларына кантип ишенсе болот?

Zipf Мыйзамынын текстин анализдөө - кадимки эне сүйлөөчүнүн сөздөрдү колдонуу өзгөчөлүктөрүн эске алган жалпы статистикалык анализ. Албетте, эрежеден тышкары учурлар бар. Эгер белгилүү жазуучулардын айрым чыгармаларын Zipf мыйзамы боюнча баалаганга аракет кылсаңыз, күбөлүк өтө таң калыштуу болушу мүмкүн. Бирок, классиктердин тили орточо статистикалык сүйлөөгө туура келбейт.

Текстти Zipf боюнча анализдөө веб-сайттарды илгерилетүүгө байланыштуу кандайдыр бир жол менен байланышы барлардын бардыгы талап кылат. Бул копирайтерлер, веб программисттер жана SEO оптимизаторлору. Тексттин табигый мүнөзүнүн жогорку көрсөткүчтөрү макаланы издөө тутумунун жогору жагындагы орун менен камсыз кылышы мүмкүн. Текстти Zipf Мыйзамынын анализин жакшы жазуу үчүн, ачкыч сөздөрдү чоң тыныгуулар менен колдонуу керектигин унутпаңыз. Көпчүлүк учурда, кардарлар аткаруучулардан көрсөтүлгөн ачкыч сөздөрдү жана белгилүү бир колдонуунун жыштыгын камтыган тексттерди түзүүнү талап кылышат. Мындай текст Zipfдин анализине ылайык, төмөн баллга ээ болот. Туура техникалык тапшырма - бул кардар копирайтерге текстте алардын колдонулушунун саны менен чектелбестен, ачкычтарды гана өзү берет. Андан кийин текстте кайсы сөз көп кездешээрин аныктоо жетиштүү, ал эми калгандарынын бардыгын макалада анын колдонулуш жыштыгына жараша камтыйт.

Сунушталууда: