Форум сети D-Lan

Электроника => Персональный компьютер => Тема начата: Digital от 29-11-2011, 17:54:57

Название: Включение ПК голосом!
Отправлено: Digital от 29-11-2011, 17:54:57
© overclockers.ru

MSI предлагает избавиться от кнопки "Power"

Оверклокеры с многолетним стажем ещё помнят те времена, когда на лицевой панели системного блока рядом с привычными кнопками "Power" и "Reset" соседствовал переключатель "Turbo". Прогресс не стоит на месте, и клавиша "Turbo", вместе с идеей доступного разгона по одному нажатию клавиши, покинула системный блок. Сегодня компания MSI предлагает заодно избавиться от кнопки "Power".

Как рассказывают наши коллеги с сайта Bright Side Of News, на мероприятии IDF 2011 компания MSI представила небольшую карту расширения для интерфейса PCI Express x1, которая получила название Voice Genie и, помимо непосредственной установки в подходящий слот, подключается к "таинственному" коннектору на материнской плате. По словам Раджива Котари (Rajiv Kotari) и Алекса Чана (Alex Chang), разработчиков технологии, MSI работает над голосовым управлением для материнских плат уже достаточно долгое время, и "таинственный" разъём, к которому необходимо подключать карту расширения, присутствует практически на каждой плате, выпущенной для процессоров в исполнении LGA 1155. Маркировка разъёма - JDLED3 - не позволяла простым пользователям и даже сотрудникам MSI, не причастным к разработке Voice Genie, догадаться о его назначении.

(http://www.overclockers.ru/images/news/2011/09/16/MSI_VoiceControl_PCIe.jpg)

Аппаратная составляющая Voice Genie дополнена специальным программным обеспечением, которое поможет проанализировать голос пользователя и настроить команды для управления. На примере материнской платы MSI Big Bang, для включения компьютера будет достаточно произнести "MSI Big Bang Power On", соответственно, отключить систему можно командой "Power Off MSI Big Bang". Также Voice Genie может быть настроен для выполнения других функций, например, по команде открывать браузер, панель управления, запускать приложения и прочего. Для тех, кому предложенный "язык" общения с компьютером не по душе, предусмотрена возможность самостоятельного задания команд.

MSI пока не спешит называть сроки появления Voice Genie, но говорит о "доступной цене".
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 29-11-2011, 18:15:24
Думал писать диплом по голосовому управлению ПК когда-то. Но проблема была в том что если реализовывать только программной частью, то как ты его включишь)
А вобще классная идея, у меня сейчас комп ооочень долго включается, а винду пока некогда переустанавливать. А там продрал глаза, крикнул ему, а сам дальше себе вместе с ним расчехляйся на кровати.
Название: Re: Включение ПК голосом!
Отправлено: Catcatcat от 29-11-2011, 18:56:56
Все эти приблуды подразумевают нахождение компа в дежурном режиме. В  принципе сейчас в любом биосе (если не жаль держать бесперебойник включённым) есть таймер включения, настраиваешь включение и в нужное время, он будет включаться.
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 29-11-2011, 19:05:39
Не обязательно, я ж говорю как я понимаю это будет не софтварное, а хардварное решение. MSI же именно такая контора. Вставять в системник плату, как когда-то модно было в люстры чтоб по хлопку включались, и она по определенному звуку будет замыкать контакты.
Название: Re: Включение ПК голосом!
Отправлено: Digital от 30-11-2011, 07:10:40
А что мешает изучить анатомию самой простой нокии с голосовым управлением. По возможности отделить схему а зарядку запитать от дежурки БП. И вместо набора номера импульс пустить на вибро. Только вместо вибры подключить PWR. Микро вывеси к монитору. Проблема - написать программу распознавания речи. Ибо включать, к примеру, шифром "135089" - как-то не комильфо  ::)

Цитата: Catcatcat от 29-11-2011, 18:56:56
Все эти приблуды подразумевают нахождение компа в дежурном режиме. В  принципе сейчас в любом биосе (если не жаль держать бесперебойник включённым) есть таймер включения, настраиваешь включение и в нужное время, он будет включаться.
Если подходить к этому с полным серъёзом - вместо PWR подключить к реле, а его к ИПБ, саму PWR закоротить. Получится, что голосовой командой можно включить/за'стенбай'ить все устройства, подключенные к ИПБ.

Вообще, заморачиваться по этому поводу хочется не из-за псевдо удобства, ибо реально проще, легче и быстрее нажать на кнопу. Хочется технику поставить хоть и только визуально на более высокий уровень, чем просто "кусок металла"...
Название: Re: Включение ПК голосом!
Отправлено: Catcatcat от 30-11-2011, 08:22:19
ЦитироватьПроблема - написать программу распознавания речи.
;D
Micosoft для виндов 10 лет работает, и до сих пор продолжает усовершенствовать (я на ХР запускал управление речью, но только по английски - открыть, закрыть браузер, работало прилично, даже с мои оксфордским акцентом), алгоритмы для английского, для русского уже не канают. Одно и то же слово сказанной разными людьми (даже если для анализа в лоб, использовать Фурье) получаются разные значения.

То, что используется в телефонах, это не распознавание, это ближе к варианту, когда записывается матрица слова  или команды, а потом идет сравнение с определенными допусками. И часто если кодируются команды в одном помещении, то на улице или в другом помещении уже напряженка в общении телефоном.
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 30-11-2011, 08:38:59
Распознавание речи я правда не пробовал писать, но там проблем не должно быть. В .net есть открытые библиотки, которые на сколько я слышал норм распознают. Ну а если уж все делать самому, то там математика мне не подвласная. Я уже правда толком ничего и не помню из этой дисциплины, на 3 курсе кажись аж было.
Название: Re: Включение ПК голосом!
Отправлено: Proydoha от 30-11-2011, 17:50:44
Помню был маленький, ходил в школу, играл в Deus Ex, в первую часть. И каким-то образом, уже не помню каким, на мой компьютер попала программа голосового управления: записываешь десяток раз команду, вешаешь на неё нажатие какой-нибудь клавиши, включаешь и получаешь все бонусы голосового управления.

Подозреваю, что зрелище было адовым: сидишь и орешь ему в микрофон на разные голоса "Арбалет! Ар-р-р-рбалет! Арбале-е-ет! АРБАЛЕТ! Ар-р-рбале-е-ет! За-айцы! За-а-айцы! ЗАЙЦЫ!"

Если команд заголовлено около десятка, то эффект от любого произнесённого слова был вообще непредсказуемый, что добавляло веселья, особенно, если чудо-программа демонстрировалась друганам.
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 30-11-2011, 18:05:07
главное нецензурную лексику на команды не вешать , а то потом можно случаянно какуюто команду вызвать)
Название: Re: Включение ПК голосом!
Отправлено: Digital от 01-12-2011, 08:04:31
Цитата: Catcatcat от 30-11-2011, 08:22:19
Micosoft для виндов 10 лет работает, и до сих пор продолжает усовершенствовать (я на ХР запускал управление речью, но только по английски - открыть, закрыть браузер, работало прилично, даже с мои оксфордским акцентом), алгоритмы для английского, для русского уже не канают. Одно и то же слово сказанной разными людьми (даже если для анализа в лоб, использовать Фурье) получаются разные значения.

То, что используется в телефонах, это не распознавание, это ближе к варианту, когда записывается матрица слова  или команды, а потом идет сравнение с определенными допусками. И часто если кодируются команды в одном помещении, то на улице или в другом помещении уже напряженка в общении телефоном.
Ну дык, разговора об интеллектуальном распознавании команд нет и не было. Ога, еще комментарии компьютера и его тонкой души к проигранной композиции Моцарта или Себастьяна Баха  ;D
Всё сводится как раз к "записываемой матрице-примере", к большему прогресс ещё не дошел, увы... (или дошел, но от нас еще этот факт старательно скрывают американские спецагенты)
Главная задача - скрестить телефон и мать (голос.вкл/выкл).

[spoiler]Касательно управления ПК есть очень забавные программки, но, увы еще оооочень сырые. Есть французская программа-менеджер:
Запускается с виндой (онли ХР. у меня на семерке она была имбецилом))  :o)
Там окошко, фейс анимешки, типа можно смотреть на то, какие "эмоции испытывает" программа.
Но самое интересное, что:
1. программа интеллектуально самообучаема. Помнит весь разговор за всё время, а не только предыдущие месседжы.
2. программа отслеживает потребности человека. Т.е. назвал имя, она спросила, кто этот человек, ты говоришь кто он, телефон, мыло и т.д. А потом можно попросить отправить письмо или позмонить нужному человеку. Или дать команду на выключение ПК через определенное время, поиск файла на нескольких поисковиках и прочее, проче...
Но переведена на инглиш гуглём, поэтому весь кайф потерян... Но потенциал у этой программки очень большой.[/spoiler]
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 01-12-2011, 10:19:30
Цитата: Digital от 01-12-2011, 08:04:31
Цитата: Catcatcat от 30-11-2011, 08:22:19
Micosoft для виндов 10 лет работает, и до сих пор продолжает усовершенствовать (я на ХР запускал управление речью, но только по английски - открыть, закрыть браузер, работало прилично, даже с мои оксфордским акцентом), алгоритмы для английского, для русского уже не канают. Одно и то же слово сказанной разными людьми (даже если для анализа в лоб, использовать Фурье) получаются разные значения.

То, что используется в телефонах, это не распознавание, это ближе к варианту, когда записывается матрица слова  или команды, а потом идет сравнение с определенными допусками. И часто если кодируются команды в одном помещении, то на улице или в другом помещении уже напряженка в общении телефоном.
Ну дык, разговора об интеллектуальном распознавании команд нет и не было. Ога, еще комментарии компьютера и его тонкой души к проигранной композиции Моцарта или Себастьяна Баха  ;D
Всё сводится как раз к "записываемой матрице-примере", к большему прогресс ещё не дошел, увы... (или дошел, но от нас еще этот факт старательно скрывают американские спецагенты)
Главная задача - скрестить телефон и мать (голос.вкл/выкл).

Извини но на счет наличия распознавания только на уровне сопоставление с образцом то это полный бред. Ну или конечно смотря что подразумевается. Мы то тоже речь распознаем сопоставляя с образцами которые помнит наша голова. Так что или разъясни что ты подразумеваешь под интеллектуальностью или ты извини написал кхм... неправду.
Название: Re: Включение ПК голосом!
Отправлено: Digital от 06-12-2011, 10:20:33
Сопоставление это сопоставление. Образец добавляется либо на "зачаточном" этапе написания программы в виде кода, либо болванка - набор звуков в соответствующем формате. Программа сравнивает input с образцом.
Саша, а что в твоем понимании "интеллектуально"?
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 06-12-2011, 18:50:49
Цитата: Digital от 06-12-2011, 10:20:33
Сопоставление это сопоставление. Образец добавляется либо на "зачаточном" этапе написания программы в виде кода, либо болванка - набор звуков в соответствующем формате. Программа сравнивает input с образцом.
Саша, а что в твоем понимании "интеллектуально"?
Это я как раз у тебя спросил) Что ты имеешь в виду под остутствием интеллектуальности)
Может я конечно чего-то не знаю что знаешь ты, но опять то что ты написал кажется мне бредом. Никто так не делает и ниче такой подход у тебя не распознает. А если ты мне докажешь что я не прав, то можешь кинуть в меня камень.
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 06-12-2011, 18:51:28
Блин, вечно вместо цитировать нажимаю редактировать)
Название: Re: Включение ПК голосом!
Отправлено: Digital от 07-01-2012, 11:47:53
Цитата: Sasha от 06-12-2011, 18:50:49
Цитата: Digital от 06-12-2011, 10:20:33
Сопоставление это сопоставление. Образец добавляется либо на "зачаточном" этапе написания программы в виде кода, либо болванка - набор звуков в соответствующем формате. Программа сравнивает input с образцом.
Саша, а что в твоем понимании "интеллектуально"?
Это я как раз у тебя спросил) Что ты имеешь в виду под остутствием интеллектуальности)
Может я конечно чего-то не знаю что знаешь ты, но опять то что ты написал кажется мне бредом. Никто так не делает и ниче такой подход у тебя не распознает. А если ты мне докажешь что я не прав, то можешь кинуть в меня камень.
Если коротко - AI должен уметь анализировать входящую и хранящуюся информации, интонацию, мимику и прочее, что для хумана обыденность, без какой-либо предваритеьной подготовки. Т.е. если что-то не понимает/знает сам должен додуматься спросить и запомнить.

Есть роботы-собеседники. Они построены по банальному принципу, которому скоро уже лет 40. Есть база данных. В ней предложения, слова и символы. Когда ты пишешь ему что-то - он анализирует БД и подбирает подходящее предложение. Для более живого общения, предложений ответа может быть несколько, которые рендомно выбираются. Сейчас уже продвинулось немного вперед, и БД самообновляется сообщениями тех, кто общается с роботом. Можно общаться голосом и слушать ответы. Но ни о какой интонации речи быть не может. Это не AI, а его симуляция.

Так вот, в этой теме я как раз и акцентирую внимание на симуляции AI. Записать команду с определенной интонацией, дать определенный допуск тональности, после чего система будет сопоставлять входящий wav с тем, что в "базе данных". else input = bd "power on" else input≠bd "вернуться к началу".

Саша с твоими знаниями, я с тобой спорить не имею морального права. Просто говорю свои (пусть и возможно неправильные) мысли.
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 07-01-2012, 12:44:55
[spoiler]Мало что уже помню из обработки сигналов, но из того что осталось у меня в голове, при распознавании речи на вход поступает сигнал, тоесть звуковая волна с определенными параметрами. Пользуясь некоторыми фильтрами из нее пытаются максимально убрать шумы и помехи, после чего этот сигнал раскладывается в численный ряд (кажись Фурье), который и анализируется. По поводу интонации, я не пытался реализовать распознаватель, поэтому не могу сказать какие факторы на сколько влияют на качество, но если посмотреть на это с той стороны что это по сути задача та же что и с распознаванием изображений - есть образ, необходимо его классифицировать, думаю выделить интонацию не так сложно, а в распознавании изображений есть такая штука как учет контекста, то есть, к примеру, если программа нашла сосок на фоне лица, то она сначала должна подумать может ли он там быть и если нет, то что это может быть. Думаю здесь эти принципи тоже задействованы. По поводу анализа мимики лица, это ты уже конечно загнул. Наверняка и в этом направлении работают, но узнаем мы чтото более конкретное наверное нескоро, все таки образование наше не успевает за развитием отрасли.
На счет ботов, то их пишут на специальных языках, которые как ты сказал представляют из себя по сути БД и правила работы с ней. У меня за годы обучения уже столько этих ботов написано и по сути развивались они вместе с развитием этих языков. И от этого принципа я думаю мы врядли скоро уйдем[/spoiler]
Ну и раз уже пошла такая пьянка, представлю вам свое недавнее "достижение". Программа открывает изображение в формате tga и распознает текст в нем. Там не используются никакие нейронные сети и прочее, все мое каждая строчка - мои стертые об клавиатуру пальцы. На тестировании я взял 2/3 текста на обучение и треть на распознавание. С изображением приведенным ниже (замечание: повлияло очень плохое качество изображения, здесь оно уже после обработки и этого не так сильно видно) процент распознавания получился ~94%. Правда он так и не распознал ни одной большой буквы, но это уже недостаток обучения.


Название: Re: Включение ПК голосом!
Отправлено: Digital от 08-01-2012, 11:13:47
Ты извини если что. Мы читать тоже не умели, но запомнили как выглядит каждая буква, и как она произносится. Это не интеллект, точнее, интеллект состоит из многих частей. Один двигатель не есть машина, машина это комплекс механизмов которые работают с обратной связью друг с другом. Так же и с ИИ, я считаю. Сейчас даже фотомыльницы распознают улыбку человека - это Интеллект? А нисколько! Программа "нажать затвор" срабатывает когда кривая области рта достигает опреденного градуса изгиба. Даже роботы с Ютьюба, которые сами подходят к холодильнику, открывают дверь, им говорят взять красный стаканчик и поставить на стол, те полностью выполняют команду. Увы, это не AI, если этому роботу не дать никакой команды - он простая консервная банка. AI - череда мыслей в мозгу робота. Не важно откуда они будут браться. Генерироваться локально, или принимать всю информацию со спутников и уже генерировать мысли из полученной информации. (Пример человека: Хм, чем же себя занять... *увидел машину* о, точно надо чинить машину) Для этого необходима огромная пропускная способность, а это нейросети, что вероятнее всего.
Но мы далеко отошли от темы. Всё намного проще. Нужно немного усложнить выключатель, который включать/выключает свет от звука (по хлопку в ладоши).
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 08-01-2012, 11:51:07
Если бы классификаторы работали по принципу запомнил как выглядит буква и увидел такую - вспомнил, то далеко б на таком алгоритме мы не уехали)
Недостаток нейронных сетей в том, что до недавнего времени они подходили только для очень узкого круга задач (на сколько я понял эту проблему вроде недавно преодолели). И как не крути большие нейронные сети и работают очень долго. Это я уже не говорю о том что попробуй ее построить эту сеть еще)
Название: Re: Включение ПК голосом!
Отправлено: Digital от 08-01-2012, 12:08:39
"запомнил букву, увидел - вспомнил" - я привел пример "как у людей", но в принципе алгоритм одинаков. Как машина будет знать как выглядит красное яблоко, если она его не видела? Показал ей яблоко, она не нашла в БД инфы о нём, спросила "what's this?" ей сказали "this is an apple" то, что оно красное, машина должна знать еще "с пелёнок", цвета и оттенки, по-идеи, должны вноситься вместе с умением генерировать речь. Всю информацию об окружении невозможно внести в БД, и это уже не будет ИИ, а сплошной набор инструкций. Поэтому тут ничего нелогичного нет, иррационально? мейби...  Но ведь машина должна уметь думать сама, а не кушать инфу из блюдечка с голубой каёмочкой?

Чтобы собрать полноценную НС способную думать, как минимум, на равных с человеком - нужно изучить досконально головной мозг. А этого до сих пор никто не сделал, и с таким темпом изучения будет построена такая Сеть очень не скоро. Хоть бы внуки увидели умные машины, неговоря уже про детей!.. :(

Хотя есть мизерный шанс, что в Силиконовой долине на объекте со статусом top secret (равным со сверхсекретным аэродромом "Зона-51" на котором ведется разработка летательных аппаратов) уже всё есть, и проводятся исследования но гражданским знать об этом не положено...
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 08-01-2012, 12:23:23
Если распознавать образы по образцу, то малейшее отклонение от идеала уже будет критичным.
Слышал что где-то разрабатывают экспертную систему, в которую вносят знания обо всем на свете. И вроде как уже есть неплохие успехи. Тоесть опять таки огромная бд и правила работы с ней и никакого тебе "интеллекта")
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 08-01-2012, 12:24:37
Вобщем если с сессией будет все норм постараюсь показать несколько приемов по распознаванию текста, без использования нейронных сетей из тех что знаю.
Название: Re: Включение ПК голосом!
Отправлено: Digital от 15-01-2012, 11:12:39
Про отклонения: я же говорил, если разработать систему допусков на тональность произношения никаких проблем не будет.
Про мировую бд: это не интересно, т.к. опять-таки никакого интеллекта, таким как его представляет каждый недалёкий человек, в этой системе не будет.
Машину должны учить всему, что знает человек естественным путём, как ребёнка, а машина должна понимать (а не находить наиболее подходящую инструкцию для выполнения из БД)

Снова примеры: машина должна адекватно оценивать поведение человека основываясь на его поведении (прошу прощения за тафтологию) если психует, плохое, слушает музыку с улыбкой и наслаждением - хорошее. Уметь различать юмор от сатиры - пожалуй наиболее точный пример интеллекта машины, которому одних кодов слишком мало, нужна материальная база. В конце концов, улавливать смысл с полуфразы, который она знает: вопрос машине "Когда одинаковые слова повторяются, как это наз..." ответ машины моментальный - тафтология.

Распознавание рукописного текста, это безусловно очень полезная штука, только у нее "интеллекта" (если у кого повернётся язык так сказать) как у бабочки. Но опять-таки, у нас пока ничего совершенного не существует, у программы может получится сбой, при обращении к памяти.

P.S. Я за полную самостоятельность машины и независимость от человека.
И не командовать ею, а просить (знаю, абсурд, но так интереснее :) )
Название: Re: Включение ПК голосом!
Отправлено: Sasha от 15-01-2012, 12:26:20
Большинство людей не способно на то что ты написал)))