Категории

Блог
Справочная литература
- Справочники
- Энциклопедии
- Прочая справочная литература
- Руководства
- Словари
Научные и научно-популярные книги
- Шпаргалки
- Биофизика
- Ботаника
- Экология
- Биохимия
- О животных
- Государство и право
- Рефераты
- Математика
- Зарубежная публицистика
- Транспорт, военная техника
- Педагогика
- География
- Зоология
- География
- Ветеринария
- Зарубежная психология
- Астрология
- История
- Психология
- Деловая литература
- Политика
- Прочая научная литература
- Религиоведение
- Химия
- Радиотехника
- Архитектура
- Техническая литература
- Юриспруденция
- Науки: разное
- Любовные романы
- Психология, личное
- Медицина
- Научпоп
- Науки о космосе
- Беременность, ожидание детей
- Языкознание
- Детская психология
- Физика
- История Европы
- Культурология
- Социология
- Психотерапия
- Образовательная литература
- Биология
- Воспитание детей, педагогика
- Альтернативная медицина
- Учебники
- Литературоведение
- Филология
- Иностранные языки
- Обществознание
Проза
- Антисоветская литература
- Семейный роман/Семейная сага
- Новелла
- Юмор
- Феерия
- Сентиментальная проза
- Современная проза
- Классическая проза
- Повести
- Советская классическая проза
- Русская классическая проза
- Историческая проза
- Русская современная проза
- Контркультура
- Зарубежная современная проза
- Проза
- Зарубежная классика
- О войне
- Эпистолярная проза
- Магический реализм
- Разное
- Рассказы
- Афоризмы
- Очерки
- Эссе
Фантастика и фэнтези
- Ироническое фэнтези
- Ненаучная фантастика
- Романтическое фэнтези
- Бизнес
- Альтернативная история
- Научная Фантастика
- Социально-психологическая
- Фэнтези
- Юмористическая фантастика
- Космическая фантастика
- Разная фантастика
- Русское фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Попаданцы
- Киберпанк
- LitRPG
- Городская фантастика
- Сказочная фантастика
- Мистика
- Эпическая фантастика
- Детективная фантастика
- Героическая фантастика
- Историческое фэнтези
- Разное фэнтези
- Боевое фэнтези
- Зарубежная фантастика
- Технофэнтези
- Иностранное фэнтези
- Любовное фэнтези
- Историческая фантастика
- Романтическая фантастика
- Городское фентези
- Книги магов
- Космоопера
- Ироническая фантастика
- Социально-философская фантастика
- Стимпанк
- Постапокалипсис
Любовные романы
- Порно
- Эротика
- Фемслеш
- Любовно-фантастические романы
- Современные любовные романы
- Короткие любовные романы
- Остросюжетные любовные романы
- Исторические любовные романы
- love
- Зарубежные любовные романы
- Роман
- Прочие любовные романы
Детская литература
- Школьные учебники
- Детская познавательная и развивающая литература
- Детские детективы
- Книга-игра
- Книги для подростков
- Детская проза
- Сказка
- Учебная литература
- Прочая детская литература
- Детская образовательная литература
- Детская фантастика
- Детские остросюжетные
- Детские приключения
- Детский фольклор
- Книги для дошкольников
- Детские стихи
- Зарубежные детские книги
- Внеклассное чтение
Религия и духовность
- Хиромантия
- Религия: окультизм
- Религия: протестантизм
- Религия: ислам
- Индуизм
- Религия
- Прочая религиозная литература
- Эзотерика
- Самосовершенствование
- Религия: христианство
- Язычество, паганизм
- Православие
- Буддизм
- Зарубежная религиозная литература и эзотерика
- Религии: разное
- Религия: иудаизм
Юмор
- Комедия
- Сатира
- Юмористическая проза
- Юмористическое фэнтези
- Прочий юмор
- Юмористические стихи
- Драматургия
- Анекдоты
Детективы и Триллеры
- Юридический триллер
- Зарубежные боевики
- Детектив
- Классический детектив
- Криминальный детектив
- Крутой детектив
- Полицейский детектив
- Триллер
- Боевик
- Шпионский детектив
- Иронический детектив
- Исторический детектив
- Иностранный детектив
- Политический детектив
- Маньяки
Поэзия, Драматургия
- Верлибры
- Зарубежная драматургия
- в стихах
- Палиндромы
- Водевиль
- Мистерия
- Экспериментальная поэзия
- Визуальная поэзия
- Басни
- Эпическая поэзия
- Зарубежная поэзия
- Поэзия
- Драматургия
- Драма
- Трагедия
- Лирика
- Песенная поэзия
- Сценарии
- Театр
- Киносценарии
- Кино, театр
Бизнес
- Работа с клиентами
- Кадровый менеджмент
- Ораторское искусство / риторика
- Личная эффективность
- Менеджмент
- Государственное и муниципальное управление
- Зарубежная деловая литература
- Переговоры
- Делопроизводство, офис
- Корпоративная культура, бизнес
- Управление, подбор персонала
- Менеджмент и кадры
- Маркетинг, PR, реклама
- Финансы
- Бизнес
- О бизнесе популярно
- Экономика
- Малый бизнес
- Тайм-менеджмент
- Бухучет и аудит
- Поиск работы
- Ценные бумаги и инвестиции
- Краткое содержание
- Банковское дело
- Продажи
- Личные финансы
- Интернет-бизнес
Разная литература
- Зарубежная литература о культуре и искусстве
- Отраслевые издания
- Начинающие авторы
- Подростковая литература
- Зарубежная прикладная литература
- Шахматы
- Недвижимость
- Спецслужбы
- Пословицы, поговорки
- Культура и искусство
- Современная литература
- Истории из жизни
- Прочее
- Периодические издания
- Фанфик
- Гиды, путеводители
- Военное
- Военная техника, оружие
- Современная зарубежная литература
- Литература 19 века
- Музыка, танцы
- Военная история
- Газеты и журналы
- Зарубежная образовательная литература
- Кино
- Визуальные искусства
- Музыка, музыканты
- Авто и ПДД
- Великолепные истории
- Изобразительное искусство, фотография
- Боевые искусства
- Цитаты из афоризмов
- Готические новеллы
Компьютеры и Интернет
- Компьютерное "железо"
- Программирование
- Прочая околокомпьтерная литература
- Программы
- Интернет
- Базы данных
- Программное обеспечение
Документальные книги
- Биографии и Мемуары
- Публицистика
- Прочая документальная литература
- Критика
- Искусство и Дизайн
- Военная документалистика
Домоводство, Дом и семья
- Фэн-шуй
- Домашнее хозяйство
- Охота
- Ремонт в квартире
- Интерьеры
- Рыбалка
- Спорт
- Эротика, Секс
- Кулинария
- Здоровье
- Прочее домоводство
- Сад и огород
- Хобби и ремесла
- Развлечения
- Домашние животные
- Семейная психология
- Сделай сам
- Дом, семья
- Отдых / туризм
Приключения
- Зарубежные приключения
- Вестерн
- Прочие приключения
- Путешествия и география
- Исторические приключения
- Морские приключения
- Приключения про индейцев
- Природа и животные
Старинная литература
- Зарубежная старинная литература
- Прочая старинная литература
- Европейская старинная литература
- Мифы. Легенды. Эпос
- Античная литература
- Фольклор
- Древнерусская литература
- Древневосточная литература

Меню

Самые читаемые

Мачеха Золушки - попаданка - Мария Максонова

Десерт для мажора и Лисёны - Маргарита Аланина

30 золотых за истинную - Наталья Дорофеева

Мы сгорим вместе. Сводные. - Маргарита Аланина

Россия в кривых зеркалах. Том 1 - Николай Левашов

RUSBOOK.SU » Документальные книги » Публицистика » Новые соединения. Цифровые космополиты в коммуникативную эпоху - Этан Цукерман

Новые соединения. Цифровые космополиты в коммуникативную эпоху - Этан Цукерман

23.05.2024 - 21:01 1 0

Категория: Документальные книги / Публицистика
Название: Новые соединения. Цифровые космополиты в коммуникативную эпоху
Автор: Этан Цукерман

Описание Новые соединения. Цифровые космополиты в коммуникативную эпоху - Этан Цукерман

Этан Цукерман, директор Центра по изучению гражданских медиа при Массачусетском технологическом институте (MIT), интернет активист и блогер, в своей дебютной книге описывает как социальные сети, транспортные хабы и новые информационные технологии, изменяют нашу жизнь. Новый взаимосвязанный мир функционирует не совсем так, как представляют себе технооптимисты и колумнисты специализированных изданий, но тем не менее он уже существует, и научиться жить в нем, адекватно используя интернет и прочие инструменты во благо, а не во вред, – задача, которая стоит сегодня необычайно остро.

Читать онлайн Новые соединения. Цифровые космополиты в коммуникативную эпоху - Этан Цукерман

Шрифт:

Интервал:

Закладка:

Сделать

1 ... 29 30 31 32 33 34 35 36 37 ... 69

Перейти на страницу:

Понятно, что англоязычные новостные ресурсы не смогли послать своих корреспондентов в Ланьсян проверить информацию Times. Понятно также, что сотрудники большинства освещающих Китай ресурсов не в состоянии читать материалы крупнейших китайских газет, и это вызывает серьезную озабоченность. Однако не прошло и суток после публикации, как материал Qilu был переведен на английский язык и размещен на EastSouthWestNorth – сайте, который ведет признанный переводчик с китайского на английский Роланд Сун. И хотя на сайт Суна ежедневно заходят многие представители англоязычного мира, следящие за китайскими СМИ, журналисты, освещающие эти события, не обратили внимания на материал газеты Qilu. Из всего этого можно сделать вывод, что даже при наличии перевода важного материала его легко пропустить, если он не лежит на привычных нам путях поиска информации, не оказывается у нас в почте и не выскакивает в поисковых системах, как местный новостной сайт.

Авторы New York Times, по-видимому, допустили ошибку потому, что их источники предоставили им неточную информацию. Другие англоязычные издания исказили историю, потому что не смогли или попросту не посчитали нужным прочесть, как те же события описываются в китайской прессе. Мы по-прежнему далеки от ситуации, когда англоговорящие журналисты в равной степени использовали бы китайские и английские источники для разносторонней оценки и максимально полноценного отражения событий в Китае.

Краткая история машинного перевода

7 января 1954 года представители команды Джорджтаунского университета и IBM провели в нью-йоркской штаб-квартире компании демонстрацию замечательного устройства – компьютерной системы, которая переводила русские предложения на английский язык. На следующий день Роберт Пламб писал в New York Times:

«Девушка-оператор набирает на клавиатуре следующий русский текст английскими буквами: “Mi pyeryedayem mislyi posryedstvom ryechi”. Машина практически сразу печатает перевод: “We transmit thoughts by means of speech”. Оператор, не владеющая русским, снова печатает лишенные (для нее) смысла русские слова: “Vyelyichyina ugla opryedyelyayetsya otnoshyenyiyem dlyini dugi k radyiusu”. И машина переводит: “Magnitude of angle is determined by the relation of length of arc to radius”».[186]

И пусть словарный запас разработанной Джорджтаунским университетом и IBM программы составлял всего 250 слов и знали они лишь шесть грамматических правил, все равно это был технический триумф. Тем более что память компьютера, на котором она работала, – IBM 701 – не превышала 36Кб, а писать ее пришлось на ассемблере[187] системному программисту IBM Питеру Шеридану. Поскольку программировать на IBM 701 было совсем не просто, Шеридан начал с создания прототипа программы: он собрал не знающих русского добровольцев и раздал им словарные карточки и собственные инструкции на английском языке. Задача волонтеров была сначала найти каждому английскому слову подходящий русский перевод, а затем, пользуясь инструкциями Шеридана, вычленить корень слова, выбрать верное окончание или изменить их порядок в предложении.

Если масштаб состоявшейся в 1954 году демонстрации был весьма скромным – машинный перевод составил 60 тщательно отобранных предложений, то амбиции разработчиков скромными никак не назовешь. Профессор Леон Достерт, разработавший языковую модель, столь кропотливо запрограммированную Шериданом, отметил, что, если сегодня «у нас еще нет возможности загрузить русскую книгу на одном конце и получить английский перевод на другом», в будущем «через пять лет, а может быть три года, межъязыковое преобразование смыслов посредством электронных процессов в важных функциональных областях нескольких языков вполне может стать свершившимся фактом». Для создания таких программ, считал Достерт, потребуется словарь в 20 тысяч слов и 100 грамматических правил – по сути, нужно было лишь расширить продемонстрированный уже прототип.[188]

Прогноз Достерта сегодня может показаться смехотворно оптимистичным, но система, над которой он размышлял, разрабатывалась для перевода научных журналов, а не Толстого или Пушкина. Достерт знал, что словарные системы перевода сталкиваются с серьезными проблемами из-за лингвистической неоднозначности, потому что естественный человеческий язык чрезвычайно неоднозначен. Во многих языках есть омонимы – слова с одинаковым написанием, но разными значениями, нередко встречается также полисемия – когда слово может иметь близкие, но все же различные значения в зависимости от контекста: «Отложив ручку, она протянула ручку и дернула за дверную ручку». Еще более сложные явления, такие как метафора, аллегория или каламбур, переносят задачу на еще более высокий уровень; простым подыскиванием слов в словаре и расстановкой их в грамматически правильном порядке такие задачи не решаются.

Когда переводчик решает, как перевести слово «ручка», то, прочитав и поняв фразу, он выбирает соответствующее слово на языке перевода на основе контекста, в котором это слово было использовано. На испытаниях 1954 года большинство предложений были из области физики и химии – и потому, что разработанная Джорджтаунским университетом и IBM программа должна была переводить научную литературу, и потому, что в контексте научной литературы степень неоднозначности некоторых из используемых терминов заметно снижается.

Чтобы решить проблему контекста и найти способ переводить слово «ручка» правильно, более современные системы перевода пользуются не словарями и грамматическими правилами, но статистическими и вероятностными моделями. Такие системы основываются на громадных объемах текста, так называемых корпусах. Большинство систем используют два корпуса. Первый – это набор предложений на языке перевода, позволяющий программистам разрабатывать «языковую модель». Анализируя это собрание предложений, языковая модель «понимает», что фраза «the blue car» в английском встречается чаще, чем «the car blue», и, выбирая между возможными вариантами перевода, предпочитает грамматически верный не потому, что знает правила грамматики, а потому, что этот вариант является наиболее распространенным. Второй корпус – это собрание предложений, которые были переведены людьми с одного языка на другой, с помощью этого корпуса создается «модель перевода». Модель перевода сообщает, что «el coche azul» чаще всего переводится с испанского как «синий автомобиль», хотя иногда встречается и вариант «авто цвета лазури». Так перевод нового текста становится цепью обоснованных догадок, когда модель перевода подбирает возможные эквиваленты предложения, а языковая модель стремится обеспечить грамматическую верность и читаемость.

Этот метод – статистический машинный перевод – стал возможен только в конце 1980-х. До тех пор компьютерам просто не хватало мощности для работы с огромными объемами данных, необходимыми для построения работающих моделей языка. Если для программы Джорджтаунского университета и IBM использование словаря в 250 слов было амбициозной задачей, корпус, который Google использует в качестве модели английского языка, состоит более чем из 95 миллиардов английских предложений. Учитывая объем данных, необходимых для эффективного использования этого метода, преимущество в их создании получили поисковые системы. Сам процесс индексирования сети предоставляет прекрасную возможность расширения языковых моделей. Однако даже такая система, как Google-переводчик, часто оказывается в рамках необходимости искать заслуживающие доверия параллельные корпусы текстов, а также фразы, переведенные на один или несколько языков.

Найти параллельный корпус совсем непросто, поскольку выполненный профессионалами высококлассный перевод (традиционно) стоит немалых денег. А работоспособность подобных систем обеспечивается их громадными размерами. Составленный Консорциумом лингвистических данных параллельный корпус для перевода между английским и китайским языками включает 200 миллионов слов, что много больше, чем в каждом из этих языков, однако для эффективной работы слова должны быть употреблены в самых разных контекстах. Многие тексты, которые мы могли бы использовать, как, например, переводы романов Стивена Кинга на десятки иностранных языков, остаются для нас недоступны из-за авторских прав. В поисках высококачественных переводных текстов в свободном доступе программисты часто используют правительственные документы: официальные резолюции ООН, переведенные на шесть рабочих языков организации; заседания Европейского парламента, в которых используются документы, переведенные на 23 официальных языка; постановления Канадского правительства, публикующиеся как на английском, так и на французском.

Поскольку процесс статистического машинного перевода – это, по сути, выбор наиболее вероятного перевода из набора примеров, использование таких источников приводит к возникновению забавных побочных эффектов: в машинном переводе мы все немного смахиваем на европейских парламентариев. Действительно, такие системы, как правило, куда лучше справляются с переводом официальных документов, чем с переложением полных сленга и жаргонных словечек мгновенных сообщений.

1 ... 29 30 31 32 33 34 35 36 37 ... 69

Перейти на страницу:

На этой странице вы можете бесплатно скачать Новые соединения. Цифровые космополиты в коммуникативную эпоху - Этан Цукерман торрент бесплатно.