Полезная информация

На IRC-канале #mozilla-ru можно получить техническую консультацию онлайн и, конечно же, порцию общения.

№2606-03-2007 23:34:25

ragnaar
Administrator
 
Группа: Administrators
Зарегистрирован: 14-10-2004
Сообщений: 2567
UA: Firefox 2.0
Веб-сайт

Re: Новый русский словарь hunspell

Я предполагал, что тестировать в ООо... Ночные сборки Fx3 не поддерживают Hunspell?

Отсутствует

 

№2707-03-2007 01:14:11

Unghost
Призрак-админ
 
Группа: Administrators
Откуда: Moscow, Russia
Зарегистрирован: 08-10-2004
Сообщений: 11770
UA: Minefield 3.0

Re: Новый русский словарь hunspell

ragnaar
Судя по тому, что Bug 319778 - Replace MySpell with HunSpell не FIXED - нет.


Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.

Отсутствует

 

№2807-03-2007 08:25:22

Modex
_
 
Группа: Extensions
Откуда: Краснодар, Россия
Зарегистрирован: 10-10-2004
Сообщений: 3311
UA: Minefield 3.0

Re: Новый русский словарь hunspell

Ну если кто-то на исходники применит патч из бага и сделает свою сборку, то... :rolleyes:


F.I.R.E.F.O.X.: Fearsome, Intimidating, Redhead-Eating Fiend from the Ominous Xenopolis
Скиньтесь мне на новый MacBook Pro! Кто сколько может!

Отсутствует

 

№2907-03-2007 13:33:49

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

Modex

А по-моему, в баге 319778 нет патча рабочего...

ragnaar

Я предлагаю проверять правила полу-автоматически:

1. Куча народу заносит новые слова в словарь.
2. Меньшая куча народу пишет проверочный файл.
3. Этот файл скармливается hunspell.
4. Он должен сгенерировать 2 файла: file.good и file.wrong.
5. Если размер файла с расширением wrong = 0, то все ОК, нет - исправляются ошибки.

Отсутствует

 

№3007-03-2007 16:15:09

Infant
   «»
 
Группа: Extensions
Откуда: Одесса
Зарегистрирован: 23-12-2004
Сообщений: 3671
UA: Firefox 2.0

Re: Новый русский словарь hunspell

TLemur
С четвёртым пунктом как раз и наблюдаются проблемы. Пока не начнёшь проверять орфографию никакие ошибки файлов словаря и аффиксов не показывают.


Благодарю алфавит за любезно предоставленные буквы.

Отсутствует

 

№3107-03-2007 16:49:14

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

Infant

А под линукс нету бинарника hunspell?
Запускаешь из командной строки, передаешь ему параметры, он выдает в ответ, правильно или нет.
Так-то быстрее будет, чем с OOo...

Отсутствует

 

№3207-03-2007 17:05:12

Vednier
Участник
 
Группа: Members
Откуда: В ауте
Зарегистрирован: 23-11-2006
Сообщений: 1430
UA: Minefield 3.0

Re: Новый русский словарь hunspell

а по моему патч есть
https://bugzilla.mozilla.org/show_bug.cgi?id=319778#c26


Свобода только тут - mozilla@conference.jabber.ru

Отсутствует

 

№3307-03-2007 17:09:15

Infant
   «»
 
Группа: Extensions
Откуда: Одесса
Зарегистрирован: 23-12-2004
Сообщений: 3671
UA: Firefox 2.0

Re: Новый русский словарь hunspell

TLemur
А я про Линукс и говорю. Но ведь пока не запустишь, то не узнаешь!


Благодарю алфавит за любезно предоставленные буквы.

Отсутствует

 

№3407-03-2007 21:38:52

ragnaar
Administrator
 
Группа: Administrators
Зарегистрирован: 14-10-2004
Сообщений: 2567
UA: Firefox 2.0
Веб-сайт

Re: Новый русский словарь hunspell

А под линукс нету бинарника hunspell?

Я не видел... если только в репозиториях дистрибутивов есть... Или кто-то соберет :)

Отсутствует

 

№3507-03-2007 21:55:50

Infant
   «»
 
Группа: Extensions
Откуда: Одесса
Зарегистрирован: 23-12-2004
Сообщений: 3671
UA: Firefox 2.0

Re: Новый русский словарь hunspell

ragnaar
На сайте есть в исходниках пакет. Под АСП10 нормально собирается. Под Убунту 6.10 мне не удалось, но я "большой специалист".


Благодарю алфавит за любезно предоставленные буквы.

Отсутствует

 

№3608-03-2007 20:19:42

Unghost
Призрак-админ
 
Группа: Administrators
Откуда: Moscow, Russia
Зарегистрирован: 08-10-2004
Сообщений: 11770
UA: Minefield 3.0

Re: Новый русский словарь hunspell

Infant

Под Убунту 6.10 мне не удалось, но я "большой специалист".

apt-get install hunspell не катит ;) ?


Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.

Отсутствует

 

№3709-03-2007 11:55:39

stoneflash
Хитрый Лис
 
Группа: Extensions
Откуда: Msk
Зарегистрирован: 02-04-2006
Сообщений: 4341
UA: Firefox 2.0

Re: Новый русский словарь hunspell

http://www.mozilla-russia.org/projects/ … l#encoding
мой косяк в переводе.

Проблемы с восьмибитными кодировками

Ispell и Myspell используют восьмибитную кодировку ASCII , главным недостатком которой является неуниверсальность. Хотя венгерский язык имеет стандартную кодировку ASCII (ISO 8859-2), она не отражает отразить все нюансы орфографии.

Отразить - лишнее.


«I actually hate programming, but I love solving problems» © Rasmus Lerdorf, PHP's Creator

Отсутствует

 

№3809-03-2007 12:58:11

ragnaar
Administrator
 
Группа: Administrators
Зарегистрирован: 14-10-2004
Сообщений: 2567
UA: Firefox 2.0
Веб-сайт

Re: Новый русский словарь hunspell

stoneflash
поправил, попозже выложу исправление на сайт

Отсутствует

 

№3909-03-2007 14:22:29

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

stoneflash
ragnaar

Может быть, "не позволяет отразить", тем более, что в английском так и есть - "it fails to allow a full implementation"

Отсутствует

 

№4010-03-2007 10:41:25

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

Я скомпилировал hunspell для windows.

Две версии:

С возможностью интерактивной проверки
Без возможности интерактивной проверки, только командная строка

Установка:

1. Скачать файл.
2. Положить его в каталог без пробелов, русских букв и т.п.
3. Запустить exe-файл.
4. Пользоваться :)

Протестировано на Windows XP SP2 (русская).

Отсутствует

 

№4106-08-2007 19:53:27

Vednier
Участник
 
Группа: Members
Откуда: В ауте
Зарегистрирован: 23-11-2006
Сообщений: 1430
UA: Minefield 3.0

Re: Новый русский словарь hunspell

Заменили Майспелл на Ханспелл в транке.
Разници пока не заметил. только вроде ищет быстрее


Свобода только тут - mozilla@conference.jabber.ru

Отсутствует

 

№4206-08-2007 20:25:31

stoneflash
Хитрый Лис
 
Группа: Extensions
Откуда: Msk
Зарегистрирован: 02-04-2006
Сообщений: 4341
UA: Minefield 3.0

Re: Новый русский словарь hunspell

Русский словарь не готов еще?


«I actually hate programming, but I love solving problems» © Rasmus Lerdorf, PHP's Creator

Отсутствует

 

№4307-08-2007 10:11:44

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

stoneflash

Откуда? Кто-то вроде помогать хотел :whistle:

Отсутствует

 

№4407-08-2007 15:59:44

ego
Участник
 
Группа: Members
Откуда: Москва
Зарегистрирован: 23-06-2006
Сообщений: 1538
UA: Minefield 3.0

Re: Новый русский словарь hunspell

Как помочь-то? Что делать? Кто ведет проект?

Отсутствует

 

№4507-08-2007 16:56:54

stoneflash
Хитрый Лис
 
Группа: Extensions
Откуда: Msk
Зарегистрирован: 02-04-2006
Сообщений: 4341
UA: Minefield 3.0

Re: Новый русский словарь hunspell

TLemur
Ну ты знаешь, я всегда готов! ;) Только скажи, что делать.

Добавлено Втр 07 Авг 2007 16:59:09 :
ego
Ведет Тимур


«I actually hate programming, but I love solving problems» © Rasmus Lerdorf, PHP's Creator

Отсутствует

 

№4607-08-2007 20:36:04

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

Пока надо готовить голый файл словаря.

Идем в Викитеку (http://ru.wikisource.org/wiki/%D0%9E%D1 … 0%BA%D0%B0, , копируем текст статьи. И удаляем все, кроме собственно слов в именительном падеже, без ударения и помет.
Т.е. из такого: ааро́новцы, -ев, ед. -вец, -вца, тв. -вцем должно остаться такое: аароновец

Добавлено Втр 07 Авг 2007 20:46:48 :
По идее это все делается через один перловский скрипт, но регулярные выражения - моя слабость.

Отсутствует

 

№4708-08-2007 05:48:26

Shutnik
Happy Arch Linux User
 
Группа: Extensions
Откуда: Tyumen ✈ Dnipropetrovsk
Зарегистрирован: 12-11-2005
Сообщений: 3785
Веб-сайт

Re: Новый русский словарь hunspell

TLemur
могу помочь. по каким принципам нужно "обрезать" слова?


Life's emblem here, in youth and vernal bloom,
But reason's finger pointing at the...

Отсутствует

 

№4808-08-2007 09:24:58

TLemur
Забанен
 
Группа: Members
Зарегистрирован: 18-10-2004
Сообщений: 1764
UA: Firefox 2.0

Re: Новый русский словарь hunspell

shutnik

Из такого:

Выделить код

Код:

# а 1, нескл., с. (название буквы)
# а 2, союз, частица, межд.
# а-а-а, межд.
# ааро́новец, -вца, тв. -вцем
# ааро́новский
# ааро́новцы, -ев, ед. -вец, -вца, тв. -вцем
# ааро́новщина, -ы
# абажу́р, -а
# абажу́рный
# абажуродержа́тель, -я
# абажу́рчик, -а
# аба́з, -а
# абази́н, -а
# абази́нец, -нца, тв. -нцем
# абази́нка, -и, р. мн. -нок
# абази́нский

надо сделать такое:

Выделить код

Код:

а
а-а-а
аароновец
аароновский
аароновцы
абажур
абажурный
абажуродержатель
абажурчик
абаз
абазин
абазинец
абазинка
абазинский

Т.е. убрать все пометы, все ударения, все окончания, все омонимы, все символы форматирования вики

Отредактировано TLemur (08-08-2007 09:25:58)

Отсутствует

 

№4908-08-2007 12:23:29

Shutnik
Happy Arch Linux User
 
Группа: Extensions
Откуда: Tyumen ✈ Dnipropetrovsk
Зарегистрирован: 12-11-2005
Сообщений: 3785
UA: Opera 8.0
Веб-сайт

Re: Новый русский словарь hunspell

TLemur
без проблем
завтра доберусь до пк и погляжу чего выйдет
нет ли уже выдранной базы, чтобы двойную работу не делать?


Life's emblem here, in youth and vernal bloom,
But reason's finger pointing at the...

Отсутствует

 

№5008-08-2007 12:59:48

Infocatcher
Not found
 
Группа: Extensions
Зарегистрирован: 24-05-2007
Сообщений: 4146
UA: Firefox 2.0

Re: Новый русский словарь hunspell

Я полагаю, можно так:

Выделить код

Код:

text
.replace(/^# */mg, "")
.replace(/́/g, "")
// .replace(/[ \t]+/g, " ")
.replace(/,.*$/mg, "")
.replace(/ *\d+/g, "");
var arr = text.split("\n");
for(var i = 0; i < arr.length - 1; i++)
    if(arr[i] == arr[i + 1])
        arr[i] = "";
var res = arr.join("\n").replace(/\s+/g, "\n");

Отредактировано Infocatcher (08-08-2007 13:10:18)


Прошлое – это локомотив, который тянет за собой будущее. Бывает, что это прошлое вдобавок чужое. Ты едешь спиной вперед и видишь только то, что уже исчезло. А чтобы сойти с поезда, нужен билет. Ты держишь его в руках. Но кому ты его предъявишь?
Виктор Пелевин. Желтая стрела

Отсутствует

 

Board footer

Powered by PunBB
Modified by Mozilla Russia
Copyright © 2004–2011 Mozilla Russia
Язык отображения форума: [Русский] [English]