Ниже — перевод статьи Альваро Видела (Alvaro Videla) о первом успешном опыте создания художественного текста машинами.
Эта книга стала особенной, так как она содержала первую вымышленную историю, придуманную искусственным разумом. Разумеется, и до неё были попытки, но именно она стала первой, чье содержание нам, людям, представлялось разумным. До неё потуги искусственного интеллекта в этой области оказывались лишь набором случайных предложений.
Хотя стоит упомянуть, что некоторые «ранние» опусы ИИ пользовались определенным успехом на светских раутах в литературных кругах Нью-Йорка, а китайские миллионеры зачитывали их вслух своим гостям на восьмидесятых этажах пекинских пентхаусов. Но — будем честными — эти попытки представляли собой откровенный мусор. И не более того.
Та самая «особенная» первая книга, о которой я говорю, не является чем-то выдающимся. Обычная история: пара, которая не могла быть вместе по ряду причин, этакие синтезированные Ромео и Джульетта, искусственная любовь, все дела. Был в ней и герой, отправившийся в далекие дали с множеством непреодолимых испытаний. Даже кульминация была в этой книге. Ею стала битва героя и его мрачного оппонента, могущественного, как сама жизнь.
Видите? Сюжет вполне логичен, но в нём нет ничего особенного! Ничего такого, что позволило бы Deep Writer (DW, Dewey или Дьюи — именно так величать нашего бестелесного «писателя») получить «Нобелевку» по литературе.
Интерес к книге появился тогда, когда на нескольких интернет-форумах литературные поклонники пытались воспроизвести процесс создания истории. Они пытались понять, какие книги повлияли на Дьюи. Этот вопрос привёл к расколу в суждениях о попытке воссоздать процесс написания книги. Если мы хотим знать, как программа работает, то стараемся получить исходный код любимым возможным способом, будь то декомпиляция программы или, если нам повезёт, путём чтения её в open-source репозитории.
Конечно, не все согласны с этим методом. Некоторые авторы считали, что книга является литературным объектом, и должна оцениваться исключительно исходя из своего содержания. Неважно кто автор, как он думает, каковы его предпочтения или предрассудки. Надо просто взять книгу, прочесть её и попытаться самостоятельно вникнуть в суть.
Была и другая группа людей. Они утверждали, что осознание творческого процесса авторов, их жизненных реалий, и есть определяющее в понимании книг. У авторов должны были быть предрассудки, страхи, радости, которые логически привели их к написанию именно этого содержания. Они находились в обществе со своими предполагаемыми допущениями и запретами. В таком случае авторы как бы сами являлись алгоритмом, и их чувства и предубеждения должны были быть заложены в исходный код Дьюи. То есть весь спектр чувств создателей Дьюи должен был сыграть роль в написании книги. Что они оставили местами зашифрованным, что обусловило «творческий потенциал» Dewey?
Исследователи подробно анализировали это, пытаясь найти подсказки касательно внутренней работы Dewey. Этот метод дал наиболее интересные результаты.
Вначале алгоритму скормили книги библиотеки проекта «Гутенберг», затем добавили научные тексты из Google Scholar, и уже потом — другие онлайн-ресурсы с архивами.
Чтобы дать Дьюи представление о качестве текстов, их ранжировали: работы авторов, получивших литературные премии, получили приоритет для алгоритма предпочтений относительно остальных, менее признанных, авторов. Вторым фактором, используемым для классификации входящих текстов, было то, насколько хорошо они показали себя в продажах на Amazon(!).
В алгоритме даже использовались критерии, называемые Highlights Per Sentence Ratio (HPSR), то есть как часто пользователи Kindle ставили пометки (highlights) в книгах.
Затем использовалось много фильтров, чтобы отделить зёрна от плевел. Один из них был очень чётким: не подпитывать алгоритм религиозными текстами, такими, как Библия. Эксперимент оказался интересным хотя бы потому, что невзирая на то, что Библия не была источником вдохновения для Dewey, на общий результат христианская культура повлияла, поскольку основой стала западная литература. Так что не удивительно, что персонажи Dewey 257 раз вскрикивали «Иисус!» (Jesus!) и ещё 147 раз они кричали «О, Боже» (Oh, God), не считая эвфемизмов «Gosh!».
Некоторые другие аспекты книги варьировались от странных к грустным без плавных переходов: скажем, большинство героев книги были белыми. У «экзотических» персонажей были имена, которые практически никогда не встречались в их культурах. Например, латиноамериканского торговца, который появляется в седьмой главе, Дьюи назвал Rodolfo Airondo Buñuelos (Buñuelos – это блюдо латиноамериканской кухни (жареные пончики), но такой фамилии, как Airondo, у него попросту не могло быть).
Как мы можем трактовать женских персонажей в книге Dewey? Главную героиню книги зовут Bella (Белла). Она блондинка, честная и справедливая, улыбающаяся, и всегда говорит приятным мягким голосом. Думается, ей была бы к лицу фамилия Клише (Cliché). Рядом с ней был друг, чье главное предназначение — подчеркнуть её личные качества.
Другими женскими персонажами были мать Беллы и покойная мать героя – она была убита плохим парнем в первом эпизоде книги — вполне себе типично.
Антагонистом Беллы была женщина, из тех, кого называют self-made или поднявшие себя сами. У неё было собственное дело, в стиле книги Карен Бликсен «Из Африки»1.
Итого — в истории пять женских и, ни много ни мало, 33 мужских персонажа!
И наконец, что немаловажно, — загадочное «Приложение 0», завершающее книгу. Оно состояло всего из одной страницы со следующим содержанием:
First word?=>Pair
0000010000001000000000000000100001 [… and so on].
Или в русском переводе:
Первое слово? =>Пара
0000010000001000000000000000100001 […и так далее].
Попытки понять принцип работы Dewey с помощью его исходного кода — «цветочки» по сравнению с попыткой расшифровать, что имел в виду наш искусственный писатель виду под этим «Приложением 0». Сложно сказать, была ли это ошибка программы, которая напечатала бинарное число (имея в виду какую-то ячейку памяти, например), или же это был код чего-то другого.
Бинарное число, растянутое на несколько строк, содержало двенадцать единиц (1), остальные нули (0). Оно чётко помещалось в 64-битное слово, что способствовало предположению о ячейке памяти… Но что означало (Первое слово? =>Пара)? Эту загадку решил ученый по имени Амир Родригес Монакал (Amir Rodríguez Monacal). Решение оказалось довольно простым.
Первое слово? – это указание выбирать каждое первое слово в каждом абзаце текста. Тогда вопрос состоял в том, что делать с этими первыми словами? Ответ на этот вопрос был в указании “=>Pair”, прочитанном как «пара». Идея состояла в том, чтобы соединить каждое слово с каждым числом из этой последовательности бит. Слова, которые в итоге оказались в парах с нулями, должны были быть отброшены, а те, что оказались в парах с единицами – сохранены. В итоге предложение было таким:
"The visible work left by this novelist is easily and briefly enumerated"
что в переводе звучит примерно так:
"Видимая работа, оставленная этим писателем, легко и кратко перечисляется"
1Позже коллега обратил внимание на то, что версия «Из Африки», использованная алгоритмом, была ошибочно приписана другому псевдониму Бликсен – Исаак Динесен (Isaac Dinesen). Это подтверждает наше раннее подозрение о том, что алгоритм предпочитал книги, написанные мужчинами.
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ