Учебник по искусственному интеллекту

Искусственный интеллект и машинное обучение - это технологии, которые находятся в авангарде того, что называют мировым 4th Индустриальная революция. С самого начала человечества человек стремился повысить эффективность нашей жизни и работы. Сначала люди полагались на простой ручной труд и изобретательность. Мы считаем, что именно так человек создал такие вещи, как пирамиды, Великая Китайская стена и Стоунхендж. Затем произошла первая промышленная революция, которая привела к механизации, использованию пара и воды, а также к развитию производства, путешествий и урбанизации. Вторая революция была вызвана изобретением массового производства и электричества. Внедрение электронных и цифровых технологий ознаменовало собой третью революцию и такие вещи, как компьютеры и Интернет. Сегодня мы вступаем в новую эру, которая стала возможной благодаря огромному прогрессу и практическому применению искусственного интеллекта и машинного обучения.

 

ЧЕЛОВЕК против МАШИНЫ

Искусственный интеллект призван помочь людям работать более эффективно за счет значительного сокращения времени, денег и человеческого интеллекта, необходимых для выполнения рутинных задач. Короче говоря, компьютерам предоставляются возможности самообучения, чтобы они могли точно прогнозировать результаты, выявлять закономерности и автоматически вносить коррективы на основе прошлой и текущей информации. В некоторых случаях машина начинает становиться более эффективной и такой же умной, как человечество.

 

Возможность того, что компьютеры станут такими же умными, как люди (или даже умнее) при выполнении определенных задач, вызывает споры о «человек против машины». Независимо от убеждений, мы все можем согласиться с тем, что у людей есть то, чего у компьютеров, скорее всего, никогда не будет: эмоции, интуиция и интуиция.

 

Когда люди обсуждают тему искусственного интеллекта, они часто спорят о том, какие категории или алгоритмы машинного обучения лучше. Алгоритмы машинного обучения обычно делятся на 3 типа: неконтролируемые без предварительного знания меток (помеченные данные), контролируемые с некоторым знанием меток (помеченные данные) и подкрепление, которое находится между двумя типами. Существуют более специфические алгоритмы этих категорий, такие как KNN, K-means, Decision Tree, SVM, искусственные нейронные сети, Q-обучение и т. Д. Итак, какой из них лучше? Ну, как и все в жизни, у всего есть плюсы и минусы, и когда дело доходит до машинного обучения, я стараюсь не обсуждать саму модель, а скорее перенаправляю разговор на качество данных. Модели машинного обучения работают на основе данных, и без соответствующих объемов и качества данных и типов данных модель машинного обучения может оказаться бесполезной, независимо от того, насколько она хороша в теории. Это не для того, чтобы уменьшить влияние выбора правильных алгоритмов машинного обучения. Данные и алгоритмы должны дополнять друг друга для решения конкретных случаев использования.

 

ДАННЫЕ - ПАРАМЕТР

At Звездный кибер мы начали нашу компанию с приоритетной миссией сбора данных - большого количества данных - и, что более важно, правую типы данных для решения проблемы обнаружения взлома. После того, как данные собраны, мы дезинфицируем их, выполняя дедупликацию, нормализацию и ряд других вещей. Затем мы сопоставляем данные с другими битами информации, такими как аналитика угроз, расположение загрузки файла, географическое расположение IP-адреса и многое другое. Это обогащение дает лучший контекст для набора данных в целом. Результатом этого процесса являются чистые данные, обогащенные контекстом. Только после выполнения этих важных задач мы выполняем машинное обучение.

 

AI С ОГРАНИЧЕННЫМИ И ПОЛНЫМИ ДАННЫМИ

Давайте подробнее рассмотрим пример того, как банки выполняют обнаружение мошенничества с кредитными картами. Если клиент обычно использует свою кредитную карту только в Сан-Хосе, Калифорния, но едет в Токио, Япония, впервые и пытается использовать эту карту, некоторые банки отметят это как аномалию и деактивируют кредитную карту. Это часто приводит к смущению и разочарованию покупателя, когда продавец сообщает ему, что карта отклонена. Хотя это действительно может быть аномалия "машинного обучения", она не может гарантировать деактивацию кредитной карты, поскольку это может быть законным использованием карты.

 

Корень вышеупомянутой проблемы обычно обнаруживается, потому что сами данные являются единственными (только место использования карты) и не имеют контекста, такого как время последнего использования карты, где она использовалась или как она использовалась. Если бы система сопоставляла другие биты информации, такие как время, местоположение, расстояние между местоположениями, репутация местоположения или то, как оно использовалось (например, терминал для карт или веб-сайт), алгоритм машинного обучения мог бы лучше определять фактическое мошенничество.

 

Возьмем другой пример, когда карта использовалась в Сан-Хосе, Калифорния, в 4:00 по тихоокеанскому стандартному времени, но затем использовалась снова в небольшом городе на Украине в 5:00 по тихоокеанскому времени в тот же день. Вероятность того, что это мошенничество, будет намного выше, чем в предыдущем примере. Коррелированные фрагменты данных, чтобы прийти к подобному выводу, были бы время потребуется, чтобы путешествовать расстояние до Украина, после его использования в Сан - Хосе, и использование карты в небольшом городе (репутация небольшой малолюдный город) на Украине.

 

ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

Это показывает, как искусственный интеллект может быть очень полезен при выполнении повторяющихся задач, связанных с большим количеством данных, которые люди устают выполнять, и анализировать эти данные для решения проблем. Но заменят ли технологии людей? Я склонен думать, что нет. ИИ может дать вам 90% + при решении повторяющихся задач, но 10% + усилий всегда потребуется для принятия окончательного решения проблемы. Кроме того, как и в случае с другими достижениями в области эффективности, мы можем повторно использовать наше высвободившееся время, чтобы выполнять еще больше работы, чем раньше. Один алгоритм машинного обучения лучше другого? Я считаю, что ответ заключается в понимании проблемы, которую человек пытается решить, и я также считаю, что качество данных так же важно, как и сам алгоритм.

 

Джон Петерсон

Старший вице-президент по линейке продуктов

Звездный кибер

Наверх