Я просто добавлю три скриншота:



Отличный бот 10/10. Всем рекомендую!
Привет. Меня зовут Алена Андронова, я актриса озвучивания и дубляжа. Однажды я согласилась на заказ озвучки большого массива текста для внутренних нужд банка Тинь кофф, а в итоге - я услышала себя в порно и лишилась части работы. Я подала иск в суд и хочу поделиться с вами этой историей, а также расскажу вам о том, что сейчас происходит с актерами озвучивания из-за развития нейросетей, как у нас в прямом смысле слова воруют голоса и обманывают нас в договорах. И это проблема не только нашей индустрии - сейчас легко подделать любую личность, украсть голос, подставить кого угодно – и расскажу, что мы предлагаем для того, чтобы защитить себя.
Длиннопост, для любителей слушать – есть видео, текст в основном его дублирует
Итак, всё началось для меня аж в 2019 году. В профессиональном сообществе я увидела объявление, что ищется женский голос на большой объем работы.

При обсуждении таких заказов обычно сразу назначают стоимость за объем. Задачу толком не объяснили, но такое часто бывало, особенно из-за НДА. Я отправила демо, потом прошла большой кастинг. И только после согласования я узнала, что это за компания, для которой планируется заказ, и мне прислали договор на утверждение. На первый взгляд всё было как обычно, стандартные формулировки об исполнении и обязательстве записать объем текстов. Однако уже только на самой записи выяснилось, что это объем текстов для создания нейросети.
На первой записи присутствовали представители банка, и когда я начала их расспрашивать, мне было сказано, что мой голос записывается только и исключительно для внутренних задач банка, он поможет обучить Олега и заменит собой колл-центр, на этом всё. Я тогда расстроилась, что не знала всей информации о задаче и не могла адекватно оценить проект, но раз уж договоренность была достигнута, а студия арендована, решила поверить на слово и сделать честно свою работу.
С тех пор прошло несколько лет, и год назад мой друг задал мне вопрос, озвучивала ли я порно-рекламу. Я ответила - нет, наверняка ты перепутал. Но он продолжал утверждать, что это был мой голос. Вскоре и другие знакомые и коллеги стали об этом говорить и присылать мне записи экранов, на которых при включении видео запускается откровенная порно-реклама, без какой-либо цензуры, которая озвучена синтезом моего голоса.
18+ контент, прям очень 18+ контент https://disk.yandex.ru/i/DiiinHWOcHISZg (запись с экрана тогонескажукого)
Я стала гуглить и обнаружила, что мой голос открыто доступен для любого синтеза на сайте банка и продается на многих сторонних площадках. Я начала искать юриста, а также пытаться связаться с юристами банка Т. Однако в моем договоре не было никаких контактов для связи, на отправленные письма - физические, электронные, - юристы не отвечали, а сотрудники банка, к которым я обращалась за помощью и контактами юридического отдела, отказывались мне их давать. А все это время мой голос продолжали синтезировать, им озвучивались эротические чаты, подписки и донаты на трансляциях, коммерческая реклама. Даже студии, с которыми я ранее работала как актриса, стали продавать мой синтез на телеканалы и стриминговые сервисы (как пример, документальный фильм «Космос: Новые горизонты»).

Почему я не смогла себя обезопасить? Напоминаю, это был 2019й год. Никакой пандемии, только-только внедряются первые голосовые помощники, Алиса и Олег, никто нигде не может синтезировать их голоса и о массовом синтезе вообще речи пока не идёт. К тому же, сотрудниками мне было обещано, что мой голос останется только для внутренних задач банка и я надеялась на честность со стороны такой крупной корпорации. Зря
А что же договор? В нем нет ни слова “синтез”, ни упоминания нейросетей, ни каких-либо подробностей об использовании записей. Это стандартный договор о том, что я создаю исполнение, передаю его и разрешаю его обработку. В то время это был обычный типовой договор, мы подписываем такие несколько раз в месяц. Согласование всегда было на совести студий и посредников. Конечно же, я внимательно читала договор, но в данном случае согласование шло фактически “вслепую”, так как о главном – о том, что мы пишем синтез, - в нем ни слова нет.
В дальнейшем ко мне обращались за дозаписью материала, и когда я спрашивала, для чего и куда он пойдет, мне не отвечали и переставали выходить на связь. Я сама делала запрос с просьбой банку подтвердить мне означенное соглашение ещё до публикации синтезов и осталась без ответа.
И я не одна пострадала в этой ситуации. Через год мой коллега, Павел Дорофеев, записывал для банка также и мужской голос, он уже знал от меня чуть больше о работе, задавал те же вопросы, что и я, уточнял, не пойдет ли данный материал куда-либо ещё.
Павлу было сказано, что синтез совершенно точно нужен для внутренних задач банка, а пункт о передаче голоса третьим лицам нужен лишь для того, чтобы передать материал для технического синтеза их дочерней компании.
В итоге голосом Павла сейчас озвучиваются различные видео в интернете, в том числе и ролики, направленные на осуждение действий российских войск и специальной военной операции. Мы совершенно не можем ни контролировать, ни отвечать за то, в чем участвует наш голос. Мы не можем отвечать за то, в чем люди нас услышат. А многие не способны уже отличить, где говорит синтез, а где - живой человек. А ещё плохая работа синтезов подрывает также и наш авторитет как хороших дикторов и актеров.
Почти год я потратила на попытки связаться с банком через всех, кого могла, в итоге получила ответ, что я не имею права ни на какие претензии, однако банк признает свою вину и готов выплатить мне совершенно смешную компенсацию, примерно в стоимость месяца-двух моей работы, при условии, что я полностью откажусь от всех своих претензий. Этот вариант меня не устраивает. Поэтому я подала иск и буду судиться с банком Тинькофф. Однако за этот год я узнала о синтезах и их развитии очень многое, а также о том, что сейчас происходит в связи с этим в законодательстве в России и в мире.
Я нашла в открытом доступе много голосов своих коллег, кто-то из них действительно записывал синтезы, однако почти во всех случаях условия изначально обговаривались другие или речь о синтезах не шла. Почти все проекты были записаны давно, до массового распространения нейросетей. Я общалась с разными юристами в поисках того, кто возьмется за моё дело, и узнала, что почти все известные вам голоса, записывавшие для кого-то синтез или голосовых помощников, были так или иначе обмануты и прибегали к услугам юристов. Я видела чужие договоры с другими компаниями, в которых, как и в моем, нет никаких упоминаний о синтезе и нейросетях. Я находила и голоса, которые не записывали синтезы, однако все равно появились в открытом доступе, а это означает, что кто-то, возможно, кто-то из студий, с которыми мы работаем, использовали нашу с ними работу для создания таких нейросетей. В основном эти голоса залиты на сайты, зарегистрированные на уже недействующие ИП, вроде такого и похожих аналогов.
Апогеем же всего этого являются различные телеграм-боты, вроде Silero или SteosVoice, которые вскрыли файлы из известных компьютерных игр, в том числе таких компаний, как Blizzard, CD Project Red, Riot Games и других, и синтезировали голоса актеров без их ведома и без разрешения правообладателей, и ещё и продают эти голоса. Но при этом говорят, что якобы на использование голосов получили разрешение.
Многие слышали о художниках, о том, что нейросети обучали на их работах без их ведома. Но если мы говорим о голосах - голос синтезируется не из какой-то общей массы, используется голос одного конкретного человека: его собственный тембр, его манера, его интонации, дикция. Это очень личное, это одна из вещей, в принципе составляющих часть личности человека.
Прямо сейчас список людей, которых несанкционированно синтезировали, огромный, входят в него и известные мэтры, и молодые актеры - есть там и Всеволод Кузнецов, и Ольга Плетнева, Михаил Тихонов, Татьяна Шитова, Ольга Зубкова, Юлия Горохова и многие другие. Совсем недавно вышел трейлер дополнения к игре киберпанк, озвученный полностью синтезами голосов из игры.
Удивительно то, что авторы этих ботов не только не постеснялись своровать голоса, но и стали писать актерам с предложением сделать синтез для их проекта под эгидой “защиты голосов от воровства”.

Не видите в этом никакого противоречия? Я напрямую задала вопрос создателям этих ботов, как так получилось, и вот что мне ответили.
Такую же риторику я слышала и от менеджеров банка Тин ькофф, когда говорила с ними, и от других людей, никак не заинтересованных. Правда ли это? Вот что говорит юрист Тамара Богданова, которая занимается вопросами права и сейчас много работает с темой синтезов речи:
Голос - это нематериальное благо, он принадлежит каждому человеку с рождения. Он является частью его личной биометрии, как отпечаток пальца или рисунок глаза. Банки в том числе используют распознавание по голосу в своей системе для подтверждения личности. Многие голоса мы легко идентифицируем. И когда актер или диктор подписывает договор о создании Исполнения, само собой разумеется, что он готов создавать результат, но заказчики считают, что имеют право создать синтез из личного слепка голоса и использовать его, как им вздумается, совершенно невзирая на урон, который они наносят человеку. Хотя в соответствии с подпунктом 4 пункта 1 статьи 1315 Гражданского кодекса Российской Федерации исполнителю принадлежит право на неприкосновенность исполнения, в том числе постановки, - право на защиту исполнения от всякого искажения, то есть от внесения изменений, приводящих к извращению смысла или к нарушению целостности восприятия исполнения, в его запись, в сообщение в эфир или по кабелю, при доведении исполнения до всеобщего сведения, а также при публичном исполнении постановки спектакля.
(Цитата не из видео, а из наших материалов, в видео Тамара рассказывает куда подробнее)
В итоге разные заказчики, студии или же вообще сторонние люди пытаются сослаться на то, что якобы раз актер дал право на переработку своего голоса, то с ним можно делать что угодно. Однако переработка всегда означала звукорежиссерскую обработку: чистку звука, наложение музыки и прочие действия, но никак не создание общедоступного клона своего голоса. А сейчас выходит, что, злоупотребляя своим правом, любая студия или заказчик могут стряхнуть пыль с договора 10-15-20летней давности на любую аудиокнигу или другой проект и создать из актера нейросеть. И это уже происходит! Есть история одного диктора, записавшего большой объем материалов для кафедры фонетики аж в начале 2000-х годов! И прямо сейчас он оказался синтезирован, естественно, без своего ведома.
Да и, как я говорила ранее, абсолютно любой человек может оказаться беззащитен. Создатели синтезов говорят о том, что сейчас технологии уже так продвинулись, что им нужен всего лишь небольшой слепок голоса человека, чтобы создать его копию. Буквально запись на пару минут.
В открытом доступе уже существуют сайты, обещающие сделать синтез по небольшому отрывку аудио. Представьте, что смогут делать мошенники, имея возможность в реальном времени имитировать вашу речь! Да и даже использовать уже доступные голоса - мой голос является голосом колл-центра банка, кто угодно сейчас может его синтезировать и позвонить вам от имени банка. Голос Всеволода Кузнецова является голосом Альфа-банка - а его голос для синтеза своровали из файлов видеоигр. Сейчас мы говорим не о роботизированном голосе, который можно определить - современные технологии записывают голос поверх речи, повторяя интонации и даже мелодию! Так, например, синтезируются песни из голосов разных исполнителей, например, в сети уже много записей с голосом Горшка из КиШа. Всего год-два, и синтезированный голос нельзя будет отличить от настоящего. И говоря о Горшке - как быть с вопросами этики? Уже создаются синтезы из голосов мертвых артистов и певцов - из наших коллег это, например, Владимир Вихров или Андрей Ярославцев. Насколько этично использовать их голоса по отношению, например, к их родственникам? Я считаю, что они должны как минимум давать свое согласие, а, в идеале, родственники должны получать отчисления, как это происходит с авторским правом.
И всё, о чем я говорю, происходит не только в России! Точно также воруются голоса из зарубежных игр - например, совсем недавно вышел эротический мод на Скайрим, озвученный синтезированными голосами из игры, это взволновало актеров. Дикторы, работавшие с Apple и их дочерними компаниями, были не в курсе, что их голоса используются для обучения ИИ. Прямо сейчас в Голливуде проходит забастовка актеров в том числе связанная с нейросетями - кинокомпании оживляют с помощью дипфейков мертвых актеров, а многие пытались прописать в контрактах сканирование актера с разовой оплатой и последующим вечным его использованием. Разве справедливо такое отношение к работникам от гигантов, воротящих миллионами? Тем не менее у нас же нет таких гильдий, и то, о чем я говорю, также касается единственного, что сейчас на нашей стороне - справедливости и честности.
Что же нам делать, как мы все - любой из нас, - можем защитить себя от нейросетевой подделки? И как актерам защититься от копирования их голоса и внешности? Современное законодательство не готово к такому развитию нейросетей, и мы с моим юристом, а также совместно с Союзом дикторов России, предлагаем внести ряд законодательных изменений. Мы создали петицию, в которой перечислены все предлагаемые мной правки, если вы будете с ними согласны - пожалуйста, перейдите по ссылке в описании и помогите нам собрать голоса!
ПЕТИЦИЯ О ЗАЩИТЕ ГОЛОСОВ ОТ МОШЕННИЧЕСТВА И СИНТЕЗА находится на сайте, ссылку на который Пикабу блокирует, но она есть в описании к видео
Нам очень поможет любая помощь – голоса, просмотры, комментарии, лайки. Если вы согласны, пожалуйста, помогите нам донести наши предложения до органов власти. Нам нужна помощь любых СМИ и блогеров, чтобы не оставлять все происходящее безнаказанным. Любой из вас, кто когда-либо записывал любое видео в интернете или отправлял голосовые сообщения, может оказаться в ситуации, когда его голос и внешность будет подделаны мошенниками.
Всех дикторов я прошу внимательно проверять договоры, писать в случае наличия вопросов юристам и ни в коем случае не подписывать договоры на отчуждение своего голоса, особенно если работа ведется над большим объемом текста, а все обещания по его использованию даются только на словах.
Сейчас страшно выкладывать любой обширный материал в интернет, особенно учитывая специфику нашей работы. Сейчас у нас совершенно нет никакой защиты, и даже громкое имя, как в моем случае с банком Т инькофф, не является никакой гарантией.
Я очень надеюсь, что нам вместе удастся добиться справедливости. Напоследок я хочу подчеркнуть, что я ни в коем случае не призываю запретить нейросети, однако хотелось бы защитить всех - актеров, блогеров, политиков, журналистов, художников, простых людей - от воровства, обмана и мошенничества. Хотелось бы создать возможность бороться за себя в этом новом мире. И хотелось бы, чтобы большие корпорации относились к своим наемным работникам с уважением, не уничтожая их репутацию и годы работы одним заказом, как это произошло со мной и многими другими.
Балуясь с нейросетями, я тут обнаружил занятный эффект. Проще будет объяснить его суть, пошагово рассказав о том, что было сделано.
Для начала я попросил у сетки Kandinsky 2.2 нарисовать красивую девушку, смотрящую в окно в неоновых огнях.

Потом сделал вариацию этой картинки (там есть такая опция).

Потом смешал эти две картинки.

Затем получившийся результат скрестил с первой вариацией и получил ещё один вариант.

И далее каждый следующий я смешивал с предыдущим.





















Результат прикольный. Деградация информации вплоть до полного исчезновения.
Я пробовал несколько раз с разными запросами, результат всегда один - вот такая или похожая сетка.

Помните про Пользователь создал скрипт который позволяет создавать DeepFake в один клик. Качество как по мне отличное и превосходит предыдущие решения ? Так вот, это альтернативная версия данного проекта, нацеленная на замену лица в режиме реального времени в видео с вебкамеры.
Код проекта можно найти на Github
По умолчанию программа работает на видеокартах Nvidia (я сделал запуск и на видеокартах AMD, об этом ниже)
В целом процедура запуска проста:
Выбираем лицо на которое будем менять
Нажимаем Live
Получаем вывод видео

В свою очередь, я решил сделать собственную сборку данного проекта:
Перевел интерфейс на русский язык
Внес ряд изменений в код нацеленных на повышение производительности
Чуть снизил разрешение видеопотока для того, снизив нагрузку со слабых машин
Сделал быстрый запуск для видеокарт Nvidia и AMD
В итоге получилось 2 версии: Обычная, но с чуть упрощенной процедурой установки и запуска и портативная, в которой ничего не нужно устанавливать и все идет из коробки (так называемый запуск в 1 клик).
Скачать обычную версию можно на Github
Портативную версию можно скачать:
Яндекс
С моего облака
Для запуска портативной версии вам надо будет распаковать архив и запустить файл start_portable_названиевашейкарты.bat
Дополнение: на самом деле, start_portable_amd.bat работает на всех видеокартах, поддерживающих DirectX 12. Поэтому если у вас видеокарта от Intel или же старая видеокарта Nvidia - можете попробовать запустить roop-cam в этом режиме.
Как добавить видео в OBS:
Для этого нам необходимо выбрать Захват окна. Выбираем Добавить источник > Захват окна и тут выбираем наше окошко с видео, подписанное как [python.exe]: Preview
Информация по будущим обновлениям будет выходить в моем Telegram канале. Там же, кстати, выходят и мои сборки обычного roop и refacer.
Полезнейший сервис для конца рабочей недели: поможет не сорваться на начальника или заказчика.
В одно окно пишете всё, что думаете, из второго копируете вежливый текст.





Если вам интересен творческий подход к использованию нейросетей, буду рад видеть вас в своём телеграм канале https://t.me/neuro_machine













Если подборка показалась вам интересной – буду благодарен за подписку на мой ТГ-канал Данайские нейросети, где я делаю картинки и подробно рассказываю о всех тонкостях процесса
Когда увидел на Реддите - сперва подумал, что это просто картинки по мотивам QR-кодов, этакие стилизации, но в комментариях я узнал, что все они работают. Я, конечно, всё равно не поверил, достал телефон и... Таки да! Благодаря высокой надежности QR-кодов и избыточному резервированию, они выдерживают такое издевательство. На некоторые, правда, приходится целиться подольше. Возможно, в будущем это станет нормой.

















Обратите внимание, как головные уборы влияют на восприятие персонажа – солидный Северус в фетровой шляпе, простак в вязанной и явно творческая личность в берете.







Если подборка показалась вам интересной – буду благодарен за подписку на мой ТГ-канал Данайские нейросети, где я делаю картинки и подробно рассказываю о всех тонкостях процесса
















Если подборка показалась вам интересной – буду благодарен за подписку на мой ТГ-канал Данайские нейросети, где я делаю картинки и подробно рассказываю о всех тонкостях процесса
Игрался с нейросетью яндекса - "шедеврум". Вводил множество запросов, получал более-менее ожидаемые результаты, пока не ввёл в качестве запроса русскоязычное название одного хорошего фильма - "Карты, деньги, два ствола":

К картам и деньгам вопросов нет, а вот стволы странные. Вспомнил, что в оригинале фильм называется "Lock, stock, and two smoking barrels". И ведь действительно, "barrels" нарисовала. Неужели переводит на английский, и использует наиболее прямое и распространённое значение английского слова? Проверим. Попробуем слово "glass", которое хоть и ассоциируется в первую очередь со стеклом, но чаще всего употребляется в значении "стакан". Пишем запрос "стекло", получаем:

Подозрение усилилось. Но, стакан тоже стеклянный, вдруг дело в этом? Нужно что-то, что однозначно не спутать. Слово, с несколькими разными, не связанными друг с другом значениями. И тут я придумал "nails", которое чаще всего означает "ногти", но так же ещё и "гвозди". Проверяем "гвозди":

Для меня, сомнений не осталось, нейросеть обучена на английском языке, а русскоязычные запросы просто переводит. Интересно, почему Российский яндекс решил пойти по такому пути?
Создание текстов
Gerwin — генератор текста: сценарии, блоги, даже описания товаров.
Turbo Text — создает оптимизированные тексты для сайтов, блогов и соцсетей.
ReText — ИИ-рейрайтер русскоязычных текстов.
ChatGPT Writer — пишет ответы на письма за вас.
Quillbot Paraphraser — перепишет текст в нужном стиле.
smodin.io — создает качественные тексты по заголовку.
Frase — генераторы текстов, названий, описаний, слоганов.
Story Path — тулза подскажет писателю, как развить сюжет дальше.
NovelAI — нагенерирует литературу в разных жанрах и сеттингах.
Обработка фото
Let’s Enhance — повысит разрешение, четкость и цветность фото.
Colorize — раскрасит чёрно-белые фотографии.
Crea8tiveAI Photo Refiner — улучшит качество фоток в 16 раз.
Fotor — повысит разрешение, чёткость и цветность.
Neural Love — повысит разрешение фоток до 4К.
Benzin — удалит фон с фотки.
Visual ChatGPT — отредактирует изображения через чат.
Remini — приложение, которое улучшит качество старых или размытых фото с помощью ИИ. Для Android тут.
Работа со звуком
Resemble AI — клонирует голос человека.
Audo — почистит запись от шумов и добавит им студийного качества.
AIVA — ИИ сочинит эмоциональную музыку по вашему запросу.
Zvukogram — озвучит текст на разных языках любым из 49 голосов.
NaturalReaders — загружайте текст и сервис озвучит его на 16 языках, включая русский.
Spleeter — умеет разделять аудио на отдельные дорожки.
Mubert — генерит музыку из текстового запроса.
Создание сайтов
html.to.design — превращает сайт в дизайн для Figma.
Piggy Magic — создаёт сайты в пару кликов.
uKit AI — создает или же редизайнит сайты, анализируя их содержание и целевую аудиторию.
Fronty — конвертирует картинки и наброски в HTML CSS.
Indigo.Design — конвертер дизайнов в код.
AI Website Builder — конструктов сайтов на основе ИИ.
Кодинг
AI Code Translator — переведёт ваш код с одного языка на другой.
Code Snippets AI GPT-4 — генерит код, исправляет ошибки, объясняет и пишет документацию.
Codeium — напишет код и сам потестит. Работает с кучей редакторов.
Explain an error — кидайте ошибку сюда и ИИ объяснит, из-за чего она возникла.
Aidev.codes — генератор кода для веб-страниц на основе ChatGPT.
Спасение от рутины
Otter — запишет ваши рабочие созвоны в текст.
ChatGPT Writer — пишет ответы на письма за вас, есть русский.
IntelliMail — тоже генерит имейлы за вас.
Arcwise AI — нейронка облегчит ваши мучения в Google Таблицах
Barely AI — ускорит возню с доками.
GPT for Slides — нагенерит слайды в Google Презентациях.