Пурга и Михал исключили бесплатную передачу эстонского контента иностранным разработчикам ИИ

Премьер-министр Кристен Михал и министр культуры Хейди Пурга (оба из Партии реформ) исключили возможность того, что Эстония бесплатно передаст крупным компаниям, работающим в сфере искусственного интеллекта (ИИ), данные на эстонском языке, включая принадлежащий ERR эстоноязычный медиаконтент. Такую идею ранее поддержала министр юстиции и цифровых технологий Лийза Пакоста (Eesti 200).
"Этот материал, созданный в журналистских изданиях и различных архивах, совершенно точно не следует раздавать легко и бесплатно", – заявил Михал в четверг на правительственной пресс-конференции. "Вчера мы встречались с главными редакторами региональных и крупных изданий, и этот вопрос также стал одной из ключевых тем обсуждения. Этот материал, собранный в архивах, редакциях газет и других изданиях, – ценное наследие, которое создавалось на протяжении долгого времени. Его нельзя бесплатно передавать первому, кто попросит", – добавил он.
По словам премьер-министра, в этом вопросе государство разделяет позицию изданий и высоко ценит созданные ими материалы, которые обладают значительной ценностью. "И раздавать их первым встречным – практически за рукопожатие – мы точно не должны", – подчеркнул он.

Министр культуры Хейди Пурга также отметила, что, по ее мнению, базы данных Эстонии, включая данные, находящиеся в распоряжении ERR, представляют собой огромную ценность, и их нельзя просто так передавать кому-либо. Любая передача должна зависеть от переговоров и различных условий.
"Хотя сам вектор, несомненно, правильный – для Эстонии чрезвычайно важно с культурной, экономической и, безусловно, с точки зрения безопасности иметь возможность самостоятельно разрабатывать и обучать автономные модели. И где еще нам взять стандарт качества для этого, как не в Институте эстонского языка и ERR, которые играют ключевую роль в установлении таких критериев? В этом вопросе необходимо учитывать авторские права, лицензионные соглашения и другие договорные аспекты", – пояснила Пурга.
"И если позволить себе риторическое отступление, то (материнская компания Facebook – прим. ред.) Meta ведет бизнес в нашей стране, не платя налоги. Нам следует учитывать этот факт", – добавила министр культуры.
Медиасоветник Министерства культуры Андрес Йыэсаар прокомментировал в социальных сетях подход министра юстиции и цифровых технологий Лийзы Пакоста, заявив, что сохранение эстонского языка и культуры зависит не от Meta или X, а от наших собственных возможностей в работе с ИИ и крупными языковыми моделями.
"Одно дело – просто поделиться словами, то есть языковым корпусом, это еще можно рассмотреть. Но совершенно другое – передавать контент: статьи, книги, новости, фильмы и весь созданный на основе этих слов материал. Идея, что мы должны бесплатно отдать весь авторский контент крупным компаниям, звучит примерно так же, как требование Дональда Трампа, чтобы Украина передала США свои ценные природные ресурсы в обмен на свободу. Ни одна из этих сделок не является хорошей", – заключил Йоэсаар.

Министр образования и науки Кристина Каллас отметила, что этот вопрос имеет огромное значение для будущего эстонского языка, поскольку корпус текстов на эстонском языке, доступный для крупных языковых моделей, весьма ограничен.
"Это означает, что если Министерство образования планирует с осени запустить полноценный проект по использованию искусственного интеллекта в учебных заведениях Эстонии, то главный вопрос заключается в том, действительно ли этот искусственный интеллект знает эстонский язык", – сказала она.
По словам министра образования, на данный момент языковые модели ИИ действительно используют эстонский язык, но их возможности основаны на крайне ограниченном языковом материале.
"Очень большая часть эстонского языкового корпуса сейчас недоступна для крупных систем искусственного интеллекта. Одно дело – ERR, но также недоступен и корпус Института эстонского языка. Кроме того, недоступны научные работы на эстонском языке, которые защищены лицензиями, – магистерские, бакалаврские и докторские работы", – пояснила Каллас.
"Если мы не хотим, чтобы эстонский язык превратился в такой язык, который из-за развития технологий фактически исчезнет из технологической сферы, то есть не будет использоваться в технологических решениях и не сможет в этой области дальше развиваться, – а мы этого не хотим, тогда, я считаю, будет абсолютно правильным решением сделать эти данные доступными для крупных языковых моделей", – продолжила она.
Однако министр образования подчеркнула, что это не должно происходить без ограничений и осуществлять юридически корректно.
"Обеспечение доступа к эстонскому языку крупных языковых моделей не означает, что мы делаем этот ресурс доступным для всех без каких-либо ограничений. Это вопрос договоренностей – в каком объеме это делать, есть правовые вопросы, связанные с авторскими правами, правовые вопросы, касающиеся защиты персональных данных. Все это необходимо сначала юридически урегулировать", – сказала Каллас.
"Но если вы спрашиваете меня, должна ли Эстония двигаться в направлении предоставления доступа к эстонскому языковому корпусу, то мой ответ – да, потому что в противном случае существует риск того, что эстонский язык станет гораздо более уязвимым в мировом контексте", – заключила она.
Член возглавляемой Каллас партии Eesti 200 и министр юстиции и цифровых технологий Лийза Пакоста в четверг в интервью ERR заявила, что передача эстонских данных, включая принадлежащий ERR медиаконтент на эстонском языке, крупным компаниям в сфере искусственного интеллекта бесплатно способствует достижению конституционной цели – обеспечению сохранения эстонского языка.
Редактор: Елизавета Калугина