Стилометрия, не подставляй себя.

D2

Администратор
Регистрация
19 Фев 2025
Сообщения
4,380
Реакции
0
Привет всем, миллион лет не сидел на форумах, зашел, что-то так вдохновился, что уже пишу вторую статью, пока время есть. В этот раз хочу разобрать интересную тему - Стилометрия, я вскольз упоминал об этом в своей прошлой статье, как мне кажется, это очень важная и интересная тема, если ты хочешь соблюдать анонимность в сети, в частности, при общении в чате или на форуме.
Вроде бы, никто не писал об этом, я не нашел по крайней мере, хотя это очень важно. Потому, специально для: xss.is

Введение.
Начнем с теории. Стилометрия — исследование стилистики, обычно включающее статистический анализ и относящееся к письменному тексту. Иногда этот термин может применяться к аналогичному исследованию живописи. Обычно стилометрия используется для атрибуции или датировки текста и применяется как в филологии, так и в юридической экспертизе. Последнее нам и интересно. Проще говоря, стилометрия - это наш личный и уникальный стиль письма, общения.

Судебная лингвистика.
Снова немного теории. Будем разбирать судебную лингвистику, приведу буквально пару известных примеров и в целом обсудим эту тему. В этой области криминалистическая лингвистика, применяемая к кибер-преступлениям, носит название - "Writeprint", отпечаток записи/письма дословно. Writeprint направлен на установление личности, в нашем случае - кибер преступника путем сравнения текста с огромной коллекцией неизменяемых сообщений, в принципе, даже без текстов сравнения этот метод может предоставить личную информацию об авторе, такую как пол, возраст и личность, банально, когда вы сами по глупости рассказали это.

На что трехбуквенные будут обращать внимание, изучая ваш текст?
- Лексические особенности, анализ выбора слов. Например, не товарищ полицейский, а - мусор, и тому подобное. Глупый пример, т.к. многие так пишут, но, это сильно может сузить круг, если вы используете, например, слова, которые употребляют исключительно в каких-либо регионах.
- Синтаксические особенности, анализ стиля письма, структуры предложения, пунктуация.
- Ваши индивидуальные особенности, анализ грамматических ошибок, имхо, это наиболее важный фактор, который следует учитывать, поскольку он обеспечивает относительно высокую точность идентификации вас.

Давайте разберем пару известных примеров.
- Можно привести первый пример из книги "American Kingpin" о том, как агенты изучали стиль письма Dread Pirate Roberts, он же Росс Ульбрихт, он же основатель Silk Road. Во-первых, Росс часто использовал слово "Epic", что могло давать им подсказки, на то, что он, скорее всего, был молод. Круг уже сузили. Также он использовал в своем письме смайлики, emoji. Он никогда не использовал "старомодный" дефис в смайлике в качестве носа, то есть он писал ":)" вместо ":-)". Тем не менее, его единственным отличительным признаком, было то, что вместо того, чтобы писать "да" или "ага" (yes/yeah) на форуме, Ульбрихт вместо этого всегда печатал "yea". Ну, а еще он использовал одну и ту же почту, но это уже другая история и выяснилось это позже.

- Дело OxyMonster, администратор одной из дарк площадок. Общедоступные данные показали, что у Валериуса (OxyMonster) есть аккаунты Instagram и Twitter. Агенты сравнили стиль написания OxyMonster на форуме, когда он был старшим модератором, со стилем написания Валериуса в его Instagram и Twitter. Агенты обнаружили много общего в использовании слов и пунктуации, включая слово "cheers", двойные восклицательные знаки, частое использование кавычек. Это как раз то, о чем я писал выше и в своей предыдущей статье, достаточно глупо так себя подставить, верно?

В очередной раз повторяю. Не используйте тот же стиль письма для работы, общения на форуме и т.д. что и для обычной жизни. В частности, обратите свое внимание на использование одних и тех же слов, фраз, и знаков препинания. Ограничьте количество справочных материалов, а конкретней - соц. сетей, которые трехбуквенный может использовать в качестве текста для сравнения. Не хочется же сесть из-за какого-нибудь ВКонтакте?

В сотый раз повторяю, обратите внимание на мелочи, которые могут сложить ваш пазл.
Как пример, если вы обычно отвечаете людям "ок", попробуйте отвечать "Окей"/"Хорошо" и так далее на вопросы собеседника или комментарий на форуме, либо еще как-то иначе. Вам НИКОГДА не следует использовать слова или фразы из ваших дел (даже если они не находятся в комментариях или еще где-либо публично) в обычных целях, и наоборот. Росс Ульбрихт (Silk Road) использовал "frosty" в качестве названия для своих серверов и для своего канала на YouTube, что помогло убедить правоохранительные органы в том, что Dread Pirate Roberts на самом деле Росс Ульбрихт, ну, к тому же, он использовал свою основную почту, как я писал уже выше.

Как можно противодействовать?
- Сократите объем текста, чтобы трехбуквенные не могли сравнивать вас, пиши кратко и по делу.
- Используйте любой текстовый редактор для исправления любых грамматических/орфографических ошибок, с которыми вы, возможно, регулярно сталкиваетесь.
- Сократите или измените идиомы, которые вы используете при общении, это очень важно.
- Задумайтесь, а как ваша личность влияет на ваш стиль общения: ваш псевдоним молодой? То есть, я имею ввиду, используете вы псевдоним какой-нибудь современной знаменитости, которую, например, не знают люди 50+, условно. Или старше? Более образованный? Или менее образованный?
- Обратите внимание на то, как ваш сленг и орфография могут идентифицировать вас. Во многих регионах сленг отличается друг от друга и чрезвычайно специфичен, запомните это.
- Обратите внимание на использование смайликов. В предыдущем примере агент сделал правильное предположение, что Ульбрихт, вероятно, был молод, потому что он не использовал "старомодный" дефис при написании смайлика.
- Обратите внимание на то, как вы структурируете свой текст. Используете ли вы пробел после точки или запятой? Может вы вообще не используете пробел после знаков препинания? Или используете перед и после знаков.
- Какие символы вы используете в своем письме. Вы используете "дд-мм-гггг" или "мм-дд-гггг" для обозначения дат? Вы используете “Давай спишемся в 22:00“ или ”Давай спишемся в 10 вечера" для обозначения времени?

Смайлики и структурные особенности.
- Жители СНГ, например, используют ")" вместо ":)" или ":-)" для обозначения смайлика. В остальных странах эту скобочку в конце слова люди не понимают и, очевидно, не используют.
- Особенности. В США, например, люди пишут числа с запятыми между цифрами, то есть "10,000$". Это отличается от того, как пишут у нас в СНГ. К этому же можно отнести, пишите ли вы "10кк" или "10млн", например, а может вы пишите "10000000", суть вы поняли.

Обман. Техника перевода.
После исправления орфографии и грамматики. Используйте переводчик для перевода с нескольких разных языков, прежде чем переводить обратно на язык оригинала. Эти переводы туда-сюда изменят ваши сообщения и затруднят снятие отпечатков пальцев. Т.е. русский-английский-французский-итальянский-русский.

Еще один вариант обмана. Если хотите добавить ложку говна, намеренно добавьте несколько ошибок в свои сообщения, и после этого практически всегда допускайте ошибку в одних и тех же словах, составьте список слов, в написании которых вы будете допускать ошибки, допустим, это слова "грамматический" и "произносится", очевидно, что в этот список должно входить намного больше слов.

Найдите список слов, которые вы обычно используете в своем лексиконе. Допустим, мы любим использовать сокращения, например: "ок", "лан", "збс", "кк". Убирайте все эти сокращения, это может существенно изменить ваш текст и то, как вас будут воспринимать. Вы можете изменить большинство слов на другие, например, вы можете изменить "ок" на "Хорошо"/"Договорились" и так далее.

Если вы живете в России и хотите создать впечатление, что вы из Украины, например. Вы можете использовать орфографию, лексику, и сленг в зависимости от региона.
Во-первых, вам нужно будет понять о том, "откуда" ваша вторая личность, не притворяйтесь, что вы из той же Украины, но при этом понятия не имеете ничего о ней, кроме того, что она существует. После того, как вы уже определитесь с подходящим местоположением, из которого будете удостоверять свою личность, изучите языковые различия между двумя языками, сленг, крылатые фразы и так далее.

Вывод.
Поймите и запомните, что вы должны постоянно думать о том, что и как вы пишите в личных сообщениях подельнику, задавая вопросы кому-либо, комментариях на форуме, и так далее. Будем честны, зарегистрироваться мусорам на форуме - дело двух минут, будут сидеть, читать все, что мы пишем, и не отсвечивать. Зачем себя подставлять?

ВАЖНО. Изменение вашего стиля письма для таких целей может в конечном итоге изменить ваш обычный стиль письма, что никак нельзя допускать, контролируйте все, что пишите друзьям от лица Васи Пупкина, и подельникам от лица "TrueHacker", по иронии судьбы это может сделать ваш цифровой почерк отслеживаемым, это что-то на уровне использования своей личной почты для регистрации на каком-нибудь форуме или маркетплейсе.

После того, как ты что-нибудь напишешь, 10 раз прочитай это. Доверяй, но проверяй. Всем добра.
 
Сверху Снизу