ЦеНеБлог

Заглючмо роботів

« Людський білок — їжа майбутњого? | | Український інтернет як зона недосяжності »

24 серпня 2010

Заглючмо роботів

У наш час нема нічого незвичного в тому, що інформація з одного блогу потрапляє в інші, приносячи їм популярність. Часто незаслужену: одна річ, якщо переписувач і сам вкладає душу у свій сайт, а чужі статті є ще одним засобом вираження власної думки, але часто буває так, що чужий контент потрібен лише для того, щоб заповнити сплог. Сплогерам не важливо, про що йдеться в їхньому сплозі, але для того, щоб сайт отримав не зовсім нульовий рейтинг, їм потрібен унікальний контент. Досягається це просто: береться чужа стаття й пропускається через автопереклад. На що буде схожим результат, відомо. Ви б хотіли, щоб над вашим творінням хтось так познущався? Я — ні.

Як запобігти цьому? Відповідь: зробити свої статті захищеними від автоматичного перекладу. Це дасть нам гарантію, що текст, написаний українською чи будь-якою іншою мовою, буде перекладено живою людиною, а не комп'ютером.

  1. Більшість роботів не вміють працювати з лігатурами. В більшості шрифтів є символи fi та fl, менш поширеними є ff, ffi, ffl, ſt, st. Всі вони мають вигляд групи з 2-3 латинських літер, розміщених поряд і дещо видозмінених. Не зовсім зрозуміла їх роль: формально, вони мають відображатись на місці відповідних послідовностей букв, щоб текст мав вигляд, прийнятий у західній типографіці, але автоматичне перетворення латинського тексту відбувається далеко не у всіх програмах. Безпосереднє ж використання лігатур робить текст неїстівним для багатьох програм автоматичного перекладу (на жаль, не всіх — гугл, наприклад, таки вміє їх розкладати на літери), чим ми й скористаємось.
    В сучасній кирилиці нема лігатур: часи, коли модною була в'язь, давно минули. Їх аналогом можуть бути сербські літери Љ та Њ, що повторюють обриси старописних кириличних лігатур, а також деякі літери неслов'янських алфавітів.
  2. Змішаймо алфавіти. Латиниця, кирилиця, великі букви грецького алфавіту схожі між собою, але для програм, що працюють з текстом, вони є різними символами. Якщо замінити літери їх графічними аналогами, людина зможе читати написане, для комп'ютера ж це буде повною абракадаброю. Колись я написав скрипт, який робить саме те, що нам потрібно: засмічує кирилицю латинськими символами. Крім того, ставлячи наголоси, я використовую не шифт чи послідовність з кириличної літери та знака наголосу, а готові латинські літери з акутом — це теж ускладнює робóту рóботам, зате покращує вигляд написаного.
  3. Нестандартна орфографія. У ХІХ столітті мало не кожний український автор писав своїм власним способом. Як не дивно, навіть сьогодні ми можемо без особливих труднощів читати стародруки: більшість відхилень від сучасної норми зрозуміти не важче, ніж тексти з помилками, більшість відсутніх у наш час літер мають свої аналоги в інших відомих нам мовах. Для машини ж заміна І на Ї чи Ю на Ју може стати нездоланною перешкодою.
  4. Незнанчні помлки. Читання особливо не утруднюють, зате гуглопереклад ще не вміє виправляти їх автоматично :р
  5. Можна обійтись і без усього цього, натомість скориставшись вишуканими словами, рідкісними у наш час, складними зворотами, слвотвором, жаргоном, діалектизмами — вийти за рамки вбогих знань ботів-перекладачів. Людина зрозуміє слово «автоперекладоборець», комп'ютер — ні ☺

Звичайно, всі перераховані способи мають недоліки. Нестандартні символи утруднюють не лише автопереклад, а й пошук, що також важливо. Нестандартна орфографія справляє неприємне враження на читача — надто вже важко відрізнити її ôд неграмотності чи патологічної неуважності, та й зайве експериментаторство теж не в пошані. Мовне багатство — звичайно, річ хороша, але я б не радив ритися по словниках староукраїнської мови чи змішувати науковий стиль зі стилем написів на паркані: кожен інструмент потребує досвіду, в невмілих руках результат може вийти гіршим від бажаного.

Якщо ж, на вашу думку, мета виправдовує будь-які засоби, то ось іще декілька прийомів, рекомендованих виключно для голінних ентузіастів автоперекладоборства:

  1. Графіка замість тексту чи окремих його фрагментів. Звичайно, сплогер може зробити скріншот сторінки, пропустити його через файнрідер і отримати придатний для автоперекладу текст, але кому це треба?
  2. Старописні літери: Ѧ замість Я чи Ѣ замість І виглядають незвично, але людина, хоч трохи знайома зі старими орѳоґрафіями, зрозуміє вас без особливих труднощів. Маѯимѫм, ѿ вас потѣкають неѹки.
  3. Нестандартні шрифти з нестандартним кодуванням символів. Потурбуйтесь, щоб у ваших читачів ці шрифти були, інакше не прочитають і вони.
  4. IINIIIiTb OCb TAK. BNrJIRDAE CTPAIIIHO? TNM KPAIII,E :)
  5. Будь-яка комбінація всіх можливих перерахованих способів. Або придумайте щось своє.
Автор: Python. Опубліковано 24 серпня 2010 20:07
Змінено 24 серпня 2010 22:15
Категорії: Зроби щось погане, Інтернет, Мова, Писемність