Полезная информация

Mozilla Россия — свежие версии программ Mozilla, а также масса полезной информации по каждому продукту.
  • Форумы
  •  » Флейм
  •  » Лингвисты создали программу для установления авторства текста

№111-01-2013 18:11:03

George Yves
Help you I can
 
Группа: Extensions
Откуда: Полоцк, Беларусь
Зарегистрирован: 22-05-2008
Сообщений: 1886
UA: Firefox 18.0

Лингвисты создали программу для установления авторства текста

http://news.open.by/it/97173

Лингвисты нашли способ установить автора анонимной публикации в Интернете с точностью до 80%
На хакерской конференции Chaos Communication Congress 29C3 группа американских аспирантов-лингвистов из Университета Дрекселя (Филадельфия) представила свою разработку - программу для установления авторства текста. Подобная программа может помочь в выявлении хакеров, взломщиков программ и создателей вредоносных вирусов. Инструмент деанонимизации пока что существует в виде альфа-версии; его разработка еще не завершена.
Методика, использованная создателями программы, основана на стилометрии, прикладной области лингвостилистики, занимающейся статистическим анализом письменного текста.

Программа выявляет закономерности в текстах, а также использование служебных слов, которые создают уникальное строение предложения в каждом конкретном случае. Тексты на языках, отличных от английского, переводятся на английский и тоже отлично анализируются программой, с определением автора.

Технология распознавания способна работать с текстами разных стилей. Например, можно определить автора научной работы по его сообщениям в чате, и наоборот. На выборке из 100 пользователей подпольных форумов и хакерских чатов система показала точность распознавания 80%.

Авторы считают, что систему стилометрического анализа можно успешно использовать для выявления владельцев ботнетов, продавцов нелегального товара в интернете, авторов вредоносных программ и др. Подобные возможности системы могут заинтересовать правоохранительные органы.

Исследователи провели сканирование миллионов сообщений на форумах thebadhackerz.com, blackhatpalace.com, www.carders.cc, free-hack.com, hackel1te.info, hack-sector.forumh.net, rootwarez.org, L33tcrew.org и antichat.ru с участием нескольких десятков тысяч авторов дискуссий. Программа сумела определить 300 тем обсуждений на форумах, самые популярные из которых - кардинг, сервисы шифрования, взлом паролей и инструменты для "черной" поисковой оптимизации.

Однако для выявления автора текста необходимо будет соблюсти ряд условий, которые обеспечат высокую точность анализа.

Так, в исследовании должно участвовать не более 50 авторов текстов, на каждого из которых необходимо собрать соответствующий материал - тексты совокупной длиной не менее 6500 слов. Также не представится возможным определить авторство текста, длина которого будет менее 500 слов.

Затруднить поиск могут использование автором жаргона, "альтернативного алфавита" или языка, отличного от английского, однако текст, переведенный автоматическим переводчиком, также может успешно выступать материалом для анализа.

Отметим, что в рамках того же проекта ведется и разработка "убийцы" программ, определяющих авторство, - системы, призванной помочь авторам избавиться от уникальности своих текстов.


May the FOSS be with you!

Отсутствует

 

№211-01-2013 20:05:18

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

George Yves пишет

однако текст, переведенный автоматическим переводчиком, также может успешно выступать материалом для анализа.

полная чушь
давно известен способ скрытия стилистики когда даём текст на перевод одному переводчику а потом другой переводит назад. в случае с электронным достаточно просто попереводить текст туда-обратно
вот кто угадает автора этих известных строк?
Я помню время чудес
У вас есть передо мной
Чем видение мира
Красота только

Отредактировано okkamas_knife (11-01-2013 20:05:41)


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№311-01-2013 21:14:30

voqabuhe
Участник
 
Группа: Members
Зарегистрирован: 06-12-2011
Сообщений: 3231
UA: Firefox 21.0

Re: Лингвисты создали программу для установления авторства текста

okkamas_knife пишет

вот кто угадает автора этих известных строк?
Я помню время чудес
У вас есть передо мной
Чем видение мира
Красота только

А.С. Пушкин :D

Отсутствует

 

№411-01-2013 21:27:45

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

voqabuhe
долго угадывал?:D


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№511-01-2013 21:35:46

voqabuhe
Участник
 
Группа: Members
Зарегистрирован: 06-12-2011
Сообщений: 3231
UA: Firefox 21.0

Re: Лингвисты создали программу для установления авторства текста

okkamas_knife пишет

долго угадывал?:D

Мгновенно, так что не надейся, спалят всех:D

Отсутствует

 

№611-01-2013 21:47:11

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

кстати о переводе
заходим на http://www.translate.ru/
выбираем перевод с русского на английский
набираем
сосиска в тесте
жмём перевести.ржом.
для тех кто не владеет инглишем  переведите с англиского на русский последнее слово(то что с дефисами)

Мгновенно, так что не надейся, спалят всех

это потому что знаешь оригинал и по строению и ключевым словам можно догадаться.
а если я возьму какой нибудь текст который в принципе легко гуглится и переведу его также то фиг ты найдёшь оригинал
а ищо етьс псособ ерпдумнаный бртианксими уёчынми! а также вставление в текст латиницы и замен/-\  бY|{8
у них компы зависнут от такого.


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№711-01-2013 22:13:01

voqabuhe
Участник
 
Группа: Members
Зарегистрирован: 06-12-2011
Сообщений: 3231
UA: Firefox 21.0

Re: Лингвисты создали программу для установления авторства текста

okkamas_knife пишет

набираем
сосиска в тесте
жмём перевести.ржом.
для тех кто не владеет инглишем  переведите с англиского на русский последнее слово(то что с дефисами)

Получил sausage rolls Какие дефисы?

okkamas_knife пишет

это потому что знаешь оригинал и по строению и ключевым словам можно догадаться.

Ты же намякивал, что никто не догадается, так что не спрыгивай.:)

okkamas_knife пишет

а если я возьму какой нибудь текст который в принципе легко гуглится и переведу его также то фиг ты найдёшь оригинал

Дык я и не спец и у меня нет этой чудесной программы.:)

Добавлено 11-01-2013 22:17:55

okkamas_knife пишет

а ищо етьс псособ ерпдумнаный бртианксими уёчынми! а также вставление в текст латиницы и замен/-\  бY|{8
у них компы зависнут от такого.

Ты не забывай, что речь всё же идёт о комментариях в интернете, а не о шифровках шпионов. А то тебя вообще никто не поймёт, и просто потеряется смысл писать комментарии.:D

Отредактировано voqabuhe (11-01-2013 22:17:55)

Отсутствует

 

№811-01-2013 23:03:15

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

voqabuhe пишет

Получил sausage rolls Какие дефисы?

гуглом переводил небось?
промт выдаёт sausage in the father-in-law

voqabuhe пишет

Ты же намякивал, что никто не догадается, так что не спрыгивай.

это твои догадки, я не намекал а спросил а пример действительно неудачный
слишком много народу на Я помню ....
продолжают ..чудное мгновенье.

вот попробуй эту строчку узнать:D тоже известная
один раз в течение ледяного зимнего времени

voqabuhe пишет

Ты не забывай, что речь всё же идёт о комментариях в интернете, а не о шифровках шпионов

дык не обязательно весь текст так преобразовывать. достаточно отдельных слов или букв
B эT0й cтр0чкe ecть лaтиHицa и ЦифpbI.
для тебя она легко читаема, а для машины это уже мусор.


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№911-01-2013 23:22:28

littleleshy
________
 
Группа: Members
Откуда: Москва
Зарегистрирован: 13-12-2008
Сообщений: 2504
UA: Firefox 18.0

Re: Лингвисты создали программу для установления авторства текста

okkamas_knife
Весь день искал дома сосиски, но так и не нашел.
Потом посмотрел на довольное лицо тестя и понял: сосиски в тесте..

Отсутствует

 

№1011-01-2013 23:42:51

voqabuhe
Участник
 
Группа: Members
Зарегистрирован: 06-12-2011
Сообщений: 3231
UA: Firefox 21.0

Re: Лингвисты создали программу для установления авторства текста

вот попробуй эту строчку узнатьbig_smile.png тоже известная
один раз в течение ледяного зимнего времени

Н.А.Некрасов :D

Добавлено 11-01-2013 23:57:42

okkamas_knife пишет

дык не обязательно весь текст так преобразовывать. достаточно отдельных слов или букв
B эT0й cтр0чкe ecть лaтиHицa и ЦифpbI.
для тебя она легко читаема, а для машины это уже мусор.

Ты не учитываешь, что если сильно понадобиться кого-то расколоть, то текст можно немного и отредактировать, убрать твои ухищрения вручную, а дальше дело техники.

Отредактировано voqabuhe (11-01-2013 23:57:42)

Отсутствует

 

№1112-01-2013 01:47:10

adidharma
 
 
Группа: Members
Зарегистрирован: 15-08-2011
Сообщений: 754
UA: Firefox 18.0

Re: Лингвисты создали программу для установления авторства текста

сосиска в тесте :D
img2285548a6babddc1d4c5ab1dde27f697.jpg

Отредактировано adidharma (12-01-2013 01:47:31)


pcxFirefox - лучшая сборка Лисы!

Отсутствует

 

№1212-01-2013 01:53:28

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

voqabuhe пишет

Ты не учитываешь, что если сильно понадобиться кого-то расколоть, то текст можно немного и отредактировать, убрать твои ухищрения вручную, а дальше дело техники.

при грамотном подходе расколоть нельзя.
ща в сети такое количество текстов что можно просто составлять нужный из чужих кусков.


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№1312-01-2013 04:16:05

Tiger.711
‌
 
Группа: Extensions
Откуда: из Лесу
Зарегистрирован: 30-07-2010
Сообщений: 7975
UA: Firefox 20.0

Re: Лингвисты создали программу для установления авторства текста

Вот вы все тут в шпиёнов играете, а между тем, это довольно полезный алгоритм для кибернетики, в целом, и для распознавания натуральной речи, в частности.
Но с этой стороны никто, конечно, даже не взглянул.


Большой кот... Пуфыстый... Полосатый... Зубастый (:

Отсутствует

 

№1412-01-2013 06:16:43

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

Tiger.711 пишет

, и для распознавания натуральной речи, в частности.

разве что речь граммар-наци будет распознавать, а для выведения системы из строя будут использоваться записи сантехника дяди Пети! - как загнёт чтонибудь многоэтажно рекурсивное так их машинка и сгорит!:lol:


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№1512-01-2013 08:13:41

hobo-mts
Участник
 
Группа: Members
Зарегистрирован: 08-06-2011
Сообщений: 43
UA: Firefox 18.0

Re: Лингвисты создали программу для установления авторства текста

Вспомнились Носовский и Фоменко с их нарративными текстами. Только они это делали вручную -- с компами тогда напряги были

Отсутствует

 

№1612-01-2013 09:20:48

Vladimir_S
Участник
 
Группа: Extensions
Откуда: Санкт-Петербург
Зарегистрирован: 19-09-2008
Сообщений: 4493
UA: Firefox 20.0

Re: Лингвисты создали программу для установления авторства текста

George Yves пишет

Авторы считают, что систему стилометрического анализа можно успешно использовать для выявления владельцев ботнетов, продавцов нелегального товара в интернете, авторов вредоносных программ и др. Подобные возможности системы могут заинтересовать правоохранительные органы.

Увы - сомневаюсь. Разве что как некое дополнительное косвенное подтверждение, не более того. Точность 80% явно недостаточна. Потому как любой адвокат уцепится за оставшиеся 20% акулье-бульдожьей хваткой.


"Большинство философов до сих пор придерживается весьма нефилософских воззрений на многие вопросы философии" Эдгар Аллан По

Отсутствует

 

№1712-01-2013 11:56:58

Tiger.711
‌
 
Группа: Extensions
Откуда: из Лесу
Зарегистрирован: 30-07-2010
Сообщений: 7975
UA: Firefox 20.0

Re: Лингвисты создали программу для установления авторства текста

okkamas_knife
Хаха. Проблема выделения приказов среди натуральной речи? Не, не слышал.


Большой кот... Пуфыстый... Полосатый... Зубастый (:

Отсутствует

 

№1812-01-2013 23:45:39

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

Tiger.711 пишет

Хаха. Проблема выделения приказов среди натуральной речи? Не, не слышал.

выделить мало,надо ещё ж и понять их.
как машина поймёт известную инструкцию "положь колдобину со стороны загогулины,дергани два раза за пимпочку..."?


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 

№1914-01-2013 01:22:47

Tiger.711
‌
 
Группа: Extensions
Откуда: из Лесу
Зарегистрирован: 30-07-2010
Сообщений: 7975
UA: Firefox 20.0

Re: Лингвисты создали программу для установления авторства текста

Самообучение. Техник такую словесную конструкции машине уже не раз говорил, и машина запомнила, что это означает. Плюс генетические алгоритмы, чтобы адаптироваться к каждой конкретной ситуации.


Большой кот... Пуфыстый... Полосатый... Зубастый (:

Отсутствует

 

№2014-01-2013 15:28:11

Zaycoff
Участник
 
Группа: Extensions
Зарегистрирован: 18-02-2012
Сообщений: 1411
UA: Firefox 18.0

Re: Лингвисты создали программу для установления авторства текста

Полезная программа для наших следователей - исходя из того, что для определения авторства текста нужно, чтобы в анализе принимало участие не более 50 анализируемых образцов и нужен предварительный массив текста в 6500 слов (видимо для этого и заставляют бедных школьников писать сочинения), то при грамотном подборе сравниваемых текстов под статью можно будет подвести кого угодно...

Отсутствует

 

№2114-01-2013 16:49:20

Apple hater
Участник
 
Группа: Members
Зарегистрирован: 13-01-2013
Сообщений: 53
UA: Firefox 20.0

Re: Лингвисты создали программу для установления авторства текста

О господи,до сих пор копирасты правят миром.Неужели не понятно,что как бы копирасты не старались,все равно кто-то да обойдет.

Отсутствует

 

№2214-01-2013 19:39:38

okkamas_knife
We are the Borg.       Resistance is futile.
 
Группа: Members
Зарегистрирован: 21-10-2009
Сообщений: 9558
UA: Seamonkey 2.14

Re: Лингвисты создали программу для установления авторства текста

Tiger.711 пишет

Самообучение. Техник такую словесную конструкции машине уже не раз говорил, и машина запомнила, что это означает.

ну тогда поясни  КАК она запомнит то что НЕ знает?как машина узнает что означает конкретное слово?
особенно если слово не имеет однозначного значения.

вот догадайся что означает фраза "Я у него новое железо сразу выкупил!"
можешь перечитать эту фразу хоть стотыщьраз . давай напиши что она означает!
и заметь ты человек а не программа.


я помню те времена когда обновления программ убирали проблемы и исправляли баги, а не добавляли их.
toxID:05AB9B827D896AACEE7FF4573A02FB8F025F46ADC856B98F65BC1BA9BD21A81DC98BA9C36CE3

Отсутствует

 
  • Форумы
  •  » Флейм
  •  » Лингвисты создали программу для установления авторства текста

Board footer

Powered by PunBB
Modified by Mozilla Russia
Copyright © 2004–2020 Mozilla Russia GitHub mark
Язык отображения форума: [Русский] [English]