Алгоритмы майнинга и шифрования криптовалют
В каждой криптовалюте используется свой определенный алгоритм шифрования, и именно его расшифрововает майнинговое оборудование, обеспечивая функционирование блокчейна, обработку транзакций и получая за это вознаграждение в виде монет определенной криптовалюты.
Навигация по материалу:
Что такое алгоритм шифрования криптовалют?
Алгоритмы криптовалют — это набор специфических криптографических механизмов и правил, которые шифруют цифровую валюту. Майнеры при помощи специального оборудования расшифровывают алгоритм конкретной криптовалюты — этот процесс заключается в поиске хеша.
Как только будет найден правильный хеш, то в блокчейне генерируется новый блок, в котором хранится информация о транзакциях, хеше предыдущего блока, сумме полученного майнером вознаграждения и т.д.
Процесс дешифрования (добычи монет) превращает набор случайных данных в упорядоченную систематизированную информацию, которая впоследствии записывается в блокчейн.
Сегодня насчитывается несколько десятков алгоритмов криптовалют. Некоторые алгоритмы более популярны и используются для нескольких разных криптовалют (блокчейнов).
Наиболее популярные криптографические алгоритмы шифрования на сегодняшний деть это: DaggerHashimoto, Scrypt, SHA256, ScryptNf, X11, X13, Keccak, X15, Nist5, NeoScrypt, Lyra2RE, WhirlpoolX, Qubit, Quark, Axiom, Lyra2REv2, ScryptJaneNf16, Blake256r8, Blake256r14, Blake256r8vnl, Hodl, Decred, CryptoNight, Skunk, Lbry, Equihash, Pascal, X11Gost, Sia, Blake2s.
Как видите список алгоритмов весьма велик, мы расскажем подробнее о самых востребованных и надежных из них:
- SHA256 – именно на этом алгоритме построен классический биткоин, для работы с ним видеокарт уже давно не достаточно, так как для него наши братья-китайцы изобрели специальное оборудование – АСИКи (от английской аббревиатуры ASIC (application specific integrated circuit – интегральная схема специального назначения). На этом же алгоритме основано и множество копирующих биткоин криптовалют, например, недавно появившийся BitcoinCash.
- Scrypt – на этом алгоритме работает «цифровое серебро» — Litecoin. В своё время этот алгоритм был отличной альтернативой, когда АСИКи были разработаны только для SHA256. Но времена идут, появились Scrypt-ASIC и этот алгоритм большинству майнеров тоже недоступен.
- Ethash (DaggerHashimoto) – алгоритм шифрования, нашедший применение в криптовалюте Ethereum. Для эффективной работы требуется иметь видеокарты с большим объемом ОЗУ и желательно на основе микропроцессоров AMD, хотя и Nvidia 10-й серии неплохо справляется с DaggerHashimoto.
- X11 – применяется в монетке Dash, доступен для современных видеокарт. Однако в конце 2017 — начале 2018, появились первые партии ASIC-майнеров для Dash.
- Decred – модификация алгоритма Blake256, применяется в криптомонете Decred. Можно майнить на видеокартах. Майнинг Decred чаще всего запускается параллельно с DaggerHashimoto на программе Claymore’s Dual Miner.
- CryptoNight – на основе данного алгоритма работает Monero. Алгоритм примечателен тем, что относительно неплохо вычисляется на процессорах. Конкретно в данную минуту процессор Intel Xeon E3 даёт мне около четверти доллара в сутки (сопоставимые цифры и для Intel Core I7). Смешной заработок, но у криптоинвестора любая машина должна майнить хотя бы в фоновом режиме.
- Equihash – лежит в основе валюты Zcash, довольно популярной в наше время среди майнеров на видеокартах, в силу того что сложность сети Ethereum (лидера у GPU майнеров) сильно возросла.
- X11Gost – алгоритм лежит в основе криптомонеты Sibcoin, которая еще называется «Сибирский Червонец». По сути это форк, российский аналог валюты Dash. Не буду вдаваться в криптографию, но отмечу, что в основе алгоритма лежит хеш-функция в соответствии с ГОСТ Р 34.11-2012.
Расширенная таблица алгоритмами шифрования криптовалют
В этой таблице мы перечислили все значимые алгоритмы для майнинга криптовалют, с годом их выхода и кратким описанием:
Наименование | Год | Тикер | Алгоритм | Ключевые особенности |
---|---|---|---|---|
Bitcoin | 2009 | BTC | SHA-256 | Флагман цифровых валют признан тысячью и одним правосубьектом даже Евросоюзом |
Ethereum | 2015 | ETH | Dagger-Hashimoto | Идея создание вычислительных мощностей для возможности реализации практически любого цифрового проекта |
Steemit | 2016 | STEEM | SHA-256 | Мультимедийный контент может быть встроен с других веб-хостов. |
Ripple | 2013 | XRP | ECDSA | Валюта созданная для банков, чтобы быстрее и защищеннее совершать транзакции |
DigiByte | 2014 | DGB | SHA256 | Разработана для устранения слабых мест Bitcoin & Litecoin |
Monero | 2014 | XMR | CryptoNight | Предназначенная для анонимных денежных транзакций |
Siacoin | 2015 | SC | blake2b | Главная идея хранение данных |
Litecoin | 2011 | LTC | Scrypt | Litecoin по большому счету клон Биткоин, только быстрее транзакции проходят |
EthereumClassic | 2015 | ETC | Dagger-Hashimoto | В принципе тот же эфир просто ребята чего-то не поделили и разделились, но стоит гораздо дешевле |
Dogecoin | 2013 | DOGE | Scrypt | Полностью скопированный алгоритм с Litecoin с некоторыми изменениями. Популярность обусловлена большими вложениями в рекламу и символом-картинкой с изображением знаменитой собаки известным и почитаемым в узких кругах |
NEM | 2015 | XEM | blockchain | есть сервис нотариального заверения плюс позволяет вам осуществлять мгновенные платежи и денежные переводы по всему миру, не опасаясь высоких комиссий. Все кошельки надежно защищены и исключают шанс несанкционированного доступа. |
Syscoin | 2014 | SYS | Scrypt | Имеет необычный алгоритм шифрования и ориентирован на децентрализованную торговлю. Syscoin — это не криптовалюта плюс платформа, это платформа, встроенная в криптовалюту. |
Augur | 2015 | REP | Smart contract | Augur использует мощностя для прогнозирования финансовых рынков |
Dash | 2014 | DASH | X11 | Позволяет почти полностью исключить отслеживание отправителя. По желанию пользователя можно не использовать и проводить трензакции напрямую. |
ByteCoin | 2012 | BCN | CryptoNight | Ззащищает деньги пользователя самыми безопасными и современными криптографическими алгоритмами. Их невозможно взломать. Сама попытка взлома потребует огромного количества дорогостоящей электроэнергии и вычислительной мощности суперкомпьютера. Вы единственный, кто может получить доступ к вашему кошельку. По крайней мере так утверждают разработчики |
BelaCoin | 2014 | BELA | Scrypt | Позволяет вам получать оплату за фотографии, которые вы публикуете |
lbryCoin | 2016 | LBC | LBRY | С помощью lbry пользователи могут создавать и делиться своим контентом, таким как музыка, фильмы, живопись и т.д. В процессе загрузки контента на платформу пользователь может требовать плату за доступ |
Radium | 2015 | RADS | Smartchain | Цель — задействовать возможности блокчейна для предоставления различных 100% децентрализованных сервисов. |
Decred | 2015 | DCR | Blake256 | По сути это гибридная proof-of-work proof-of-stake (PoW/PoS) консенсусная система, которая направлена на баланс между PoW майнерами и PoS избирателями что бы создать более надежное понятие консенсуса |
Einsteinium | 2014 | EMC2 | Scrypt | Наподобие kickstarter только для научных проектов |
Gridcoin | 2013 | GRC | BOINC | система, которая путем объединения вычислительных мощностей помогает решать задачи в медицине, биологии, математике, климатологии, астрофизике и других науках |
VertCoin | 2014 | VTC | Lyra2RE | Позиционирует себя как форк полностью защищенный от ASIC майнеров. Выступает против монополизации майнинга. |
Dashcoin | 2014 | DSH | CryptoNight | Анонимная криптовалюта следующего поколения так как сетевой код всегда обновляется с минимальными затратами на разработку и близкими к 0% ошибками протоколов |
Potcoin | 2014 | POT | Scrypt | Представляет легальную индустрию марихуаны |
Peercoin | 2012 | PPC | SHA-256 | Интересен возможностью получения монет не только майнингом видеокарты, но еще и генерацией новых монет — монетами уже имеющимися в кошельке |
Namecoin | 2011 | NMC | SHA-256 | Главным применением Namecoin является цензура-устойчивый домен верхнего уровня .bit, который функционально похож на .com или .net домены, но не зависит от ICANN, главного руководящего органа для доменных имен. |
Nautiluscoin | 2014 | NAUT | NXT | Цель — доказать, что электронные валюты могут быть хорошим классом инвестиционных активов. |
Expanse | 2015 | EXP | Dagger-Hashimoto | Идея состоит в том, чтобы использовать новейшую технологию blockchain для создания всего, что может представить сообщество и команда, используя децентрализованную автономную организацию с самофинансируемым дизайном, чтобы сохранить ее по-настоящему децентрализованной |
PinkCoin | 2014 | PINK | X11 | Валюта созданна на базе платформы Ethereum и обеспеченна фиксированным активом цветных бриллиантов |
FoldingCoin | 2014 | FLDC | Stanford Folding | Использует ваш компьютер для моделирования процесса сворачивания белков в теле человека. Результаты полученные в этом исследовании будут использованные на изготовление и получение новых медицинских препаратов, способов лечение а также возможно с вашей помощью будут открыты новые открытия в медицине и исследовании белка в частности, а также лечение смертельно-опасных заболеваний |
Navcoin | 2014 | NAV | X13 | При дополнительном использовании NAVTech и Tor вы можете защитить свою личность при совершении частных покупок в Интернете. |
ViaCoin | 2014 | VIA | Scrypt | |
DNotes | 2014 | NOTE | Scrypt | DNotes — peer-to-peer децентрализованная криптовалюта, передаваемая через Интернет, которая позволяет осуществлять мгновенную оплату любому человеку в мире. Это быстро и безопасно с минимальной комиссией как утверждают разработчики |
Vcash | 2014 | XVC | Blake256 | Vcash был спроектирован как инновационный и перспективный. Он предотвращает подслушивание и цензуру, способствует децентрализованным, энергоэффективным и мгновенным сетевым транзакциям. |
Алгоритмы шифрования и криптовалюты
Ниже мы подробно рассмотрим самые популярные алгоритмы шифрования криптовалют, а также монеты, которые работают на них.
SHA-256
SHA-256 — это безопасный алгоритм шифрования, который приобрел популярность после его использования в коде биткоина. Аббревиатура SHA — это Secure Hash Algorithm, а 256 означает, что алгоритм криптовалюты генерирует 256-битный хеш, т.е. строку (дайджест) размером 256 бит. Хешрейт для криптовалют, работающих на основе SHA-256, вычисляется в единицах Gigahash в секунду (GH/s). На создание блока уходит от шести до десяти минут.
Особенности
Алгоритм SHA-256 был изобретен Агентством Национальной Безопасности США в 2001 году. Он входит в семейство алгоритмов SHA и сейчас является единственным алгоритмом криптовалют из данного семейства, который прошел тест на устойчивость к таким видам атак как нахождение коллизий и нахождение прообраза, что имеет решающее решение для безопасности криптовалют, работающих на основе данного алгоритма.
Помимо криптовалют, SHA-256 также широко используется в некоторых других технологиях.
Например, работа протоколов безопасности, таких как TLS, SSL, PGP, SSH, построена на SHA-256.
В 2009 году, когда Bitcoin был известен лишь очень ограниченному кругу людей, для майнинга использовали обычные компьютеры, которые производили вычисления при помощи центрального процессора. Позже начали применять более мощные графические процессоры.
Однако сейчас, когда популярность биткоина просто огромная, экономически выгодным стало использование лишь ASIC-майнеров — специальных устройств, обладающих большой вычислительной мощностью.
Монеты алгоритма SHA-256
На алгоритме SHA-256 работает Bitcoin, а также ряд других криптовалют, которые в основном являются форками биткоина.
Криптовалюты алгоритма SHA-256:
- Bitcoin (BTC).
- Bitcoin Cash (BCH).
- Bitcoin SV (BSV).
- Emercoin (EMC).
- Namecoin (NMC).
- Peercoin (PPC).
- BitcoinDark (BTCD).
- Litecoin Cash (LCC).
Equihash
Equihash — это анонимный алгоритм криптовалют, увидивший свет в 2016 году. Первой криптовалютой, которая использовала Equihash в качестве базы, была Zcash. Создание блоков занимает 150 секунд, а хешрейт измеряется в Megahash в секунду (MH/s). В основе данного алгоритма лежит хеш-функция, которая построена на принципе «Парадокса дней рождений» — это математическая закономерность, которая используется для расчета вероятности. Правило гласит:
Если в комнате находится 23 человека, то вероятность того, что день рождения как минимум двух из них приходится на один и тот же день, составляет 50%. Исходя из этой закономерности, вероятность нахождения числа nonce в процессе майнинга равняется 2, вознесенное в степень N и разделенное на 2.
Особенности
Этот алгоритм криптовалют был разработан Александром Бирюковым и Дмитрием Ховратовичом — учеными Университета Люксембурга, которые входят в исследовательскую группу CryptoLUX. В 2016 году разработка была представлена широкому круга.
Equihash требователен к объему оперативной памяти, а не к скорости обработки математических вычислений.
Это делает майнинг «айсикоустойчивым», а сеть более децентрализованной. Для майнинга криптовалют, работающих на Equihash, используются видеокарты, обладающие минимальным объемом памяти в 2 Гб. Самые лучшие результаты показало применение графических процессоров бренда NVidia.
Однако для майнинга Equihash также были разработаны устройства ASIC. Сегодня самыми популярными являются две модели: Antminer Z9 mini от Bitmain и A9 ZMaster от менее известной компании Innosilicon. В отличие от команды Monero, разработчики Zcash не предприняли никаких действий для защиты своей криптовалюты от централизации майнинга, а лишь высказали свое огорчение.
Монеты алгоритма Equihash
Самые популярные криптовалюты, работающие на алгоритме Equihash:
- Zcash (ZEC).
- Bitcoin Gold (BTG).
- Komodo (KMD).
- ZClassic (ZCL).
- ZenCash (ZEN).
- Bitcoin Private (BTCP).
Алгоритм Ethash (Dagger Hashimoto)
Ethash (Dagger Hashimoto) — это алгоритм криптовалют, разработанный специально для майнинга Ethereum. В основу работы данного алгоритма хеширования положены два разных алгоритма: Dagger, созданный Виталиком Бутериным, и Hashimoto (название состоит из слов hash, shift, and modulo), разработанный программистом Thaddeus Dryja. Хейшрейт алгоритма Ethash измеряется в Megahash в секунду (MH/s).
Особенности
Dagger — это алгоритм криптовалют, который предъявляет жесткие требования к памяти видеокарты. Принцип его работы похож на Scrypt, однако его производительность выше, особенно это заметно в условиях повышения сложности сети.
Но Dagger имеет некоторые уязвимости, поэтому он эффективен только в паре с Hashimoto.
Алгоритм Hashimoto работает с операциями ввода/вывода в особом режиме. В частности, он ограничивает скорость добычи, из-за того, что количество памяти для записывания и считывания информации не является бесконечным.
Hashimoto — это алгоритм криптовалют, который требует большой объем памяти, за счет чего не получается выполнить большое количество операций ввода/вывода, т.е. для расшифровки не получится использовать метод бесконечного подбора случайных значений. Это и являлось основной причиной того, почему устройства ASIC не подходили для майнинга Ethereum (об этом ниже).
Для майнинга монет, работающих на основе Ethash, используется вычислительная мощность GPU-процессоров (видеокарт). Наибольшую эффективность показали видеокарты бренда AMD. Однако и применение видеокарт Nvidia 10-й серии приносят неплохой профит майнерам.
Основное требование — это высокий показатель оперативной памяти, который постоянно увеличивается из-за роста сложности сети.
Как мы говорили выше, устройства ASIC не подходили для добычи монет, работающих на основе Ethash, однако все изменилось летом 2018 года, когда крупнейший китайский производитель майнеров Bitmain выпустил в продажу модель Innosilicon A10 ETHMaster, т.е. ASIC для Ethereum.
Монеты алгоритма Ethash
Изначально Ethash был создан для Ethereum, однако этот алгоритм также используют и другие монеты. Криптовалюты, в которых используется алгоритм Ethash:
- Ethereum (ETH).
- Ethereum Classic (ETC).
- Ubiq (UBQ).
- Expanse (EXP).
- Pirl (PIRL).
- Musicoin (MUSIC).
- QuarkChain (QKC).
Scrypt — это алгоритм майнинга криптовалют, который раньше был интересен многим одиночным майнерам в виду его устойчивости к так называемой «аппаратной атаке». Скорость создания блоков в блокчейне, работающем на базе Scrypt, составляет около 30 секунд. Хешрейт как и у Ethash измеряется в Megahash в секунду (MH/s). Scrypt, прежде всего, стал популярным благодаря его применению в криптовалюте Litecoin.
Особенности
История создания этого алгоритма началась с того, что вскоре стало ясно, что майнинг биткоина очень легко монополизировать, из-за того что простота функции SHA-256 позволяет автоматизировать процесс майнинга.
Поэтому основной задачей при создании Scrypt было усложнение механизма генерации блоков за счет повышенных требований к ресурсам, используемым для вычислительных операций. В частности, решающее значение имеет объем оперативной памяти (как и в Ethash), при этом требования к энергопотреблению и вычислительной мощности намного ниже чем в случае SHA-256.
Изначально для добычи криптовалют на основе Scrypt применялись центральные и графические процессоры, однако алгоритм не мог противостоять майнинг-корпорациям и в 2014 году был создан первый ASIC для Scrypt-монет.
В ответ на это криптоэнтузиасты создали усовершенствованный алгоритм под названием Scrypt-N, который впервые был применен в монете Vertcoin. Отличается он тем, что требования к оперативной памяти постоянно растут.
Монеты алгоритма Scrypt
Алгоритм майнинга Scrypt положен в основу работы следующих криптовалют:
Litecoin (LTC).
Dogecoin (DOGE).
Redcoin (RED).
Monacoin (MONA).
Viacoin (VIA).
Syscoin (SYS).
X11 — это алгоритм шифрования, в котором вместо одной функции используются одинадцать. Это означает, что данная технология может обеспечить высокую степень безопасности, ведь чтобы нанести вред системе, злоумышленнику придется взломать все 11 функций, а это очень маловероятно, потому что внесенные изменения будут видны уже после взлома первой функции, и у разработчиков будет масса времени защитить систему, прежде чем хакер дойдет до одиннадцатой функции.
Алгоритм криптовалют X11 был создан специально для майнинга Dash.
Особенности
Данный алгоритм шифрования был разработан создателем одной из топовых криптовалют (Dash, в прошлом Darkcoin) — Эваном Даффилдом. Все началось с того, что он хотел улучшить анонимность и взаимозаменяемость биткоина, однако сообщество не одобрило его идею. Тогда Эвану не оставалось ничего, кроме как создать свою собственную криптовалюту. По словам Даффилда на разработку ушли всего лишь одни выходные.
Еще одним достоинством X11 является то, что майнинг криптовалют, созданных на его основе, является очень экономным в плане потребления энергоресурсов. Следует сказать, что энергоэффективность — это всего лишь приятный «бонус», так как Эван не ставил за цель создать алгоритм, который бы не требовал больших энергозатрат. Данное свойство заметили майнеры.
Проведенные эксперименты показали, что добыча Dash на видеокартах потребляет на 30-50% меньше электроэнергии, чем майнинг Bitcoin на ASIC-устройствах.
Для добычи монет, которые работают на основе алгоритма X11, можно использовать не только GPU, но и CPU. Это один из немногих сегодня алгоритмов, который допускает майнинг на процессорах, что делает его привлекательным для одиночных майнеров и небольших компаний. Конечно, ASIC для добычи криптовалют на основе алгоритма X11 также существуют.
Как признался сам создатель X11, он не старался создать «айсикоустойчивый» алгоритм, однако он сделал все возможное, чтобы производителям пришлось «хорошенько потрудиться».
На данный момент X11 — не единственный в своем роде, который использует больше одной хеш-функции.
По его примеру были созданы другие алгоритмы, которые также построены на интеграции нескольких хеш-функций: X12, X13, X14, X14, X15, X16 и даже X17.
Однако X11 до сих пор является самым популярным и самым используемым.
Монеты алгоритма X11
На алгоритме криптовалют X11 созданы следующие монеты:
- Dash (DASH).
- Pura (PURA).
- Tao (XTO).
- Synergy (SNRG).
- Enigma (ENG).
- CannabisCoin (CANN).
CryptoNight
CryptoNight — это алгоритм для анонимных криптовалют, в основе которого лежат такие технологии как кольцевые подписи и одноразовые адреса. Он стал, прежде всего, известен благодаря криптовалюте Monero (XMR). Генерация блока занимает около 60 секунд.
Особенности
Применение CryptoNight позволяет создать конфиденциальную, защищенную и взаимозаменяемую цифровую валюту. Эти свойства достигаются благодаря применению протокола CryptoNote, который был создан в 2012 году блокчейн-разработчиком (или группой разработчиков) под псевдонимом Николас ван Саберхаген. До сих пор неизвестно, кто скрывается за этим именем.
Высокая степень анонимности алгоритма CryptoNight достигается благодаря использованию двух технологий:
Из-за того, что транзакции являются абсолютно анонимными, все монеты, построенной на алгоритме криптовалют CryptoNight, являются взаимозаменяемыми.
Это означает, что они не имеют «темного прошлого», как, например, Bitcoin, блокчейн которого позволяет отследить движение определенного коина и его участие в «грязных делах».
Еще одна очень важная особенность данного алгоритма состоит в том, что для майнинга наиболее эффективными является использование CPU в паре с GPU, хотя добыча только на центральном процессоре тоже дает положительные результаты. И, напротив, применение устройств ASIC является экономически невыгодным.
Секрет в том, что CryptoNight требовательный к оперативной памяти (для правильной работы нужно минимум 2 Гб), а не к скорости проведения математических вычислений, в чем сильны ASIC-майнеры.
Процесс поиска правильного nonce для генерации блока состоит в том, что CryptoNight создает рандомные блоки, которые хранит в памяти вычислительного устройства, а не отправляет непрерывные частые обращения к майнеру с целью проведения математических операций, как это происходит в случае использования алгоритма SHA-256 (используемого для Bitcoin).
Это позволяет построить более децентрализованную сеть и не допустить возникновения ситуации, когда больше половины хешрейта принадлежит одному узлу, и существует высокая вероятность проведения атаки 51%.
Для эффективного майнинга криптовалют, работающих на основе CryptoNight, стоит использовать центральные процессоры Intel Core поколений i5 и i7.
Также хорошие результаты показывает применение оборудования бренда Radeon HD (новые модели). Кроме того, для майнинга криптовалют на основе CryptoNight можно использовать ASIC-майнеры.
На данный момент для этого подходят такие модели: Antminer X3, Baikal Giant-N, PinIdea RR-200, DragonMint X1/X2.
Однако стоит отметить, что Monero каждый год вносит изменения в протокол, которые помогают защитить добычу монеты от использования ASIC. Но другие монеты, работающие на CryptoNight, например, Bytecoin, Aeon, без проблем добываются при помощи ASIC.
Монеты алгоритма CryptoNight
На анонимном алгоритме CryptoNight созданы следующие криптовалюты:
- Monero (XMR).
- Bytecoin (BCN).
- DigitalNote (XDN).
- Electroneum (ETN).
- Aeon (AEON).
- CryptoNoteCoin.
SHA-256 был первым алгоритмом шифрования, который нашел свое применение в криптовалютах. Однако он является далеко несовершенным, в виду низкой степени анонимности, конфиденциальности и взаимозаменяемости. Это послужило стимулом для создания более продвинутых криптографических алгоритмов.
Монополизация сферы майнинга из-за использования огромных ASIC-ферм — это еще одна проблема криптомира. Поэтому современные алгоритмы майнинга стремятся ограничить применение ASIC устройств для добычи новых монет.
Добиться этого удается путем установления высоких требований к оперативной памяти, а не к скорости вычислений, что актуально для SHA-256. Несмотря на то что для добычи большинства монет уже созданы ASIC, их использование не всегда является экономически выгодным и оправданным.
4.9
/
5
(
61
голос
)
The following two tabs change content below.
Материал подготовлен редакцией сайта «Майнинг Криптовалюты», в составе: Главный редактор — Антон Сизов, Журналисты — Игорь Лосев, Виталий Воронов, Дмитрий Марков, Елена Карпина. Мы предоставляем самую актуальную информацию о рынке криптовалют, майнинге и технологии блокчейн.
Отказ от ответственности: все материалы на сайте Mining-Cryptocurrency.ru имеют исключительно информативные цели и не являются торговой рекомендацией или публичной офертой к покупке каких-либо криптовалют или осуществлению любых иных инвестиций и финансовых операций.
Майним Bitcoin с помощью бумаги и ручки / Хабр
В один прекрасный момент мне захотелось прикинуть, насколько быстро можно майнить биткойны вручную. Оказалось, что для майнинга используется хеширование SHA-256, а оно достаточно простое и может быть вычислено даже без компьютера. Само собой, процесс очень небыстрый и совершенно непрактичный. Но, пройдя все шаги на бумажке, можно хорошо разобраться в деталях работы алгоритма.
Один криптографический раунд
Майнинг
Ключевая часть всей системы безопасности биткойна — майнинг. Основная идея заключается в том, что майнеры группируют биткойн-транзакции в один блок, который уже подвергают хэшированию неисчислимое число для нахождения очень редкого значения хэша, подпадающего под специальные условия. Когда такое значение находится, блок считается смайненным и попадает в цепочку блоков. Само по себе хэширование не несёт никакой полезной цели кроме увеличения сложности поиска правильного блока. Таким образом, это одна из гарантий того, что никто в одиночку с любым существующим набором ресурсов не сможет взять под контроль всю систему. Подробнее про майнинг можно почитать в моей
прошлой статье
.
Криптографическая функция хэширования на вход получает блок с данными, а выдаёт небольшой, но непредсказуемый, выход. Она спроектирована так, что не существует быстрого способа получить нужный выход, и вы должны продолжать перебор пока не найдёте подходящее значение. Биткойн использует SHA-256 в качестве такой функции. Причём для усиления стойкости SHA-256 применяется к блоку дважды и называется уже двойным SHA-256.
В биткойне критерием валидности хэша является достаточное число нулей в его начале. [1] Найти такой хэш так же сложно, как, к примеру, найти номер машины или телефона, заканчивающийся на несколько нулей. Но, конечно, для хэша это экспоненциально сложнее. На текущий момент, правильный хэш должен содержать примерно 17 стартовых нулей, чему удовлетворяет только 1 из 1.4×1020. Если провести аналогию, то найти такое значение сложнее, чем обнаружить конкретную частичку среди всего песка на Земле.
На схеме ниже показан типичный блок в цепочке и его хэш. Желтым выделены байты, которые и участвуют в процессе хэширования. В данном примере хэш валиден и имеет достаточное число нулей в своём начале. Однако это нечастый случай, и обычно майнеру приходится перебирать значение поля nonce или других доступных для изменения данных.
Структура биткойн-блока
SHA-256
Алгоритм работает с данными, разбитыми на куски по 512 бит (64 байт), криптографически их смешивает и выдаёт 256-битный (32 байта) хэш. SHA-256 состоит из относительно простого раунда, повторяющегося 64 раза. Снизу, как раз, и показан такой раунд, принимающий на вход 8 4-байтовых слов — от A до H.
Один раунд SHA-256 для восьми входных слов A-H. Схема нарисована kockmeyer, CC BY-SA 3.0.
Синие блоки нелинейно перемешивают биты для усложнения криптографического анализа. Причём для еще большей надежности используются разные функции перемешивания (если вы сможете найти математическую лазейку для быстрого генерирования валидных хэшей, то возьмёте под контроль весь процесс майнинга биткойнов).
Функция большинства (Ma блок) побитово работает со словами A, B и C. Для каждой битовой позиции она возвращает 0, если большинство входных битов в этой позиции — нули, иначе вернёт 1.
Блок Σ0 циклически сдвигает A на 2 бита, затем исходное слово A циклически сдвигается на 13 бит, и, аналогично, на 22 бита. Получившиеся три сдвинутые версии A побитово складываются по модулю 2 (обычный xor, (A ror 2) xor (A ror 13) xor (A ror 22)).
Ch реализует функцию выбора. На каждой битовой позиции проверяется бит из E, если он равен единице, то на выход идёт бит из F с этой позиции, иначе бит из G. Таким образом, биты из F и G перемешиваются, исходя из значения E.
Σ1 по структуре аналогичен Σ0, но работает со словом E, а соответствующие сдвиговые константы — 6, 11 и 25.
Красные блоки выполняют 32-битное сложение, формируя новые значения для выходных слов A и E. Значение Wt генерируется на основе входных данных (это происходит в том участке алгоритма, который получает и обрабатывает хэшируемые данные. Он вне нашего рассмотрения). Kt — своя константа для каждого раунда. [2]
На схеме сверху заметно, что только A и E меняются за один криптографический раунд. Остальные слова не меняются, но сдвигаются на выходе — старое A превращается в выходное B, старое B — в новое C, и так далее. Хотя отдельный раунд алгоритма не сильно изменяет данные, но после 64 раундов, входная информация будет полностью зашифрованной. [3]
Майним вручную
На видео я показываю как можно пройти все описанные шаги с помощью ручки и бумаги. Я выполнил первый раунд хэширования для майнинга блока. Заняло это у меня 16 минут, 45 секунд.
Немного поясню что происходит: я записал слова от A до H в шестнадцатеричной форме, и под каждым сделал перевод в двоичный вид. Результат выполнения блока Ma находится под словом C, а значения A после сдвигов и сам выход Σ0 располагаются над строкой с A. Функция выбора появляется под G, и, наконец, соответствующие сдвинутые версии E и значение после блока Σ1 идут над строкой с E. В нижнем правом углу произвёл сложение, результат которого участвует в вычислении и нового A, и нового E (первые три красных блока суммирования). Справа сверху я рассчитал новое значение A, а посерёдке располагается уже расчет нового значения E. Все эти шаги обсуждались выше и легко могут быть отслежены на схеме.
Кроме того раунда, что показан в видео, я провёл еще один — последний 64-ый хэшируюший раунд для конкретного биткойн-блока. На фотографии значение хэша выделено желтым. Количество нулей подтверждает, что это валидный биткойн-хэш. Заметьте, что нули располагаются в конце хэша, а не в начале, как я писал ранее. Причина заключается в том, что биткойн, просто-напросто, переворачивает байты полученные SHA-256.
[4]
Последний раунд SHA-256, в результате которого виден успешно смайненный биткойн-блок
Что всё это значит для проектирования «железных» майнеров?
Каждый шаг в SHA-256 очень просто выглядит в цифровой логике — простые битовые операции и 32-битные суммирования (если вы когда-либо изучали схемотехнику, то, скорее всего, уже представили себе как это может выглядеть в железе). Поэтому ASIC-микросхемы реализуют SHA-256 очень эффективно, размещая параллельно сотни блоков исполнения SHA-256 раундов. Фотография ниже показывает микросхему для майнинга, которая может вычислять 2-3 миллиарда хэшей в секунду. На
Zeptobars
можно поглядеть больше фото.
Снимок кремниевого кристалла ASIC-микросхемы Bitfury, которая может майнить биткойны со скоростью в 2-3 гигахэшей в секунду. Картинка с Zeptobars. (CC BY 3.0)
В противоположность биткойну, Litecoin, Dogecoin и другие похожие альтернативные -coin системы используют алгоритм хэширования scrypt, в котором изначально заложена сложность реализации в железе. Этот алгоритм во время выполнения хранит в памяти 1024 разных значений хэша, а уже на выходе комбинирует их для получения конечного результата. Поэтому требуется куда больше памяти и схематики для вычисления scrypt-хэшей по сравнению с SHA-256-хэшами. Влияние изменения алгоритма хэширования наглядно видно при сравнении соответствующего аппаратного обеспечения для майнинга — версии под scrypt (Litecoin и прочие) в тысячи раз медленнее, чем версии под SHA-256 (биткойн).
Заключение
SHA-256 неожиданно оказался настолько простым, что может быть вычислен даже вручную (алгоритм на эллиптических кривых, который используется для подписи биткойн-транзакции, был бы куда более мучительным, так как содержит кучу перемножений 32-байтных чисел).16 раз (10 квадриллионов). Другой вопрос в стоимости энергии. Дешевым источником питания являются пончики по 23 цента за 200 килокалорий. Электроэнергия у меня стоит 15 центов за киловатт-час, что дешевле пончиков в 6.7 раз. В итоге, стоимость энергии в пересчете на хэш для меня, как человека-майнера, в 67 квадриллионов раз выше. Да-а-а, понятно, что я не ухвачу удачу за хвост ручным майнингом биткойнов, и это еще не учитывая стоимость бумаги и ручек!
Примечания и ссылки
1. На самом деле, важно не число лидирующих нулей в хэше, а то, что он должен быть меньше какого-то конкретного значения, которое зависит от
текущего уровня сложности системы
.
↑
2. Довольно занятно то, откуда пошли эти константы для SHA-256. Так как АНБ разрабатывало этот алгоритм и выбирало константы, то откуда нам знать, что они не подобрали специальные значения, чтобы быстрее ломать хэши? Дабы пресечь подобные спекуляции, начальные инициализирующие значения хэша взяты как квадратные корни из восьми первых простых чисел (первые 32 бита дробной части). А K
t
получены из кубических корней первых 64 простых чисел. Как видите, константы сгенерированы с помощью простых формул, поэтому можно доверять тому, что АНБ не придумало ничего хитрого (по крайней мере, в отношении констант).
↑
3. К моему сожалению, SHA-256 работает с блоками из 512 бит, а заголовок биткойн-блока больше. Поэтому необходим второй проход из 64 раундов хэширования. Кроме того, в биткойне используется двойной SHA-256. Таким образом, хэширование одного блока требует 192 раунда. Тем не менее, мы можем сократить это число, потому что процесс майнинга заключается в повторном хэшировании одного и того же блока, с небольшими изменениями поля «nonce» во второй половине блока. И тут возникает оптимизация за счет того, что мы можем использовать результат вычисления первых 512 бит блока повторно. В итоге, нам требуется только 128 раундов хэширования.
↑
4. Само собой, я не настолько невероятно удачлив, что нашёл сразу валидный хэш. Я начал хэширование блока, уже ранее смайнененного. Конкретно того, который уже упоминался в статье —
#286819
.
↑
5. Еще одна проблема с ручным майнингом заключается в том, что новые блоки майнятся примерно каждые 10 минут, поэтому даже если я успешно намайню блок, то он будет безнадежно устаревшим (сиротой, в терминах биткойна).
↑
Алгоритм Ethash / Хабр
Обзор алгоритма Ethash
В этой статье я расскажу про алгоритм Ethash, который используется для майнинга различных криптовалют, но главная из них это, конечно, Ethereum. Ethash — это Proof of Work (PoW) алгоритм, который является последней версией алгоритма Dagger-Hashimoto, хотя его больше нельзя назвать таковым, так как многие из исходных функций обоих алгоритмов были кардинально изменены.
Термин Proof of Work означает, что майнеры ищут решение (“nonce” или одноразовый номер), которое при хешировании выдаст значение меньше целевого порога, который предварительно задан. Из-за криптографического характера хеш-функции практически невозможно обратное вычисление одноразового номера (“nonce”), удовлетворяющего целевому пороговому пределу. Только если вручную перебирать все возможные варианты.
Алгоритм Dagger-Hashimoto был придуман путем соединения алгоритма Dagger — Виталика Бутерина (одного из основателей Ethereum) и алгоритма Hashimoto Thaddeus Dryja. Он создавался, для того чтобы затруднить майнинг для ASIC-оборудования (Application Specific Integrated Circuits), а также для того, чтобы была легкая проверка и полное хранение в цепочке.
Затруднение майнинга для ASIC-оборудования необходимо, чтобы дать возможность добывать монеты пользователям, у которых нет достаточного объема капитала для покупки таких устройств.
Многие знают, что в данный момент майнинг монет Bitcoin невозможен даже на очень мощном компьютере. Это вызвано тем, что существует большое количество майнинговых ферм, состоящих из ASIC-оборудования, и имеющие гораздо большие вычислительные мощности чем любой персональный компьютер. Именно этой ситуации старались избежать разработчики алгоритма Dagger-Hashimoto и, соответственно, Ethash.
Что же такое ASIC-устройство? Это специальное оборудование, которое создается на основе интегральных схем, специально разработанных для майнинга монет. Мощность такого устройства сравнима с общей мощностью нескольких самых продвинутых видеокарт, однако при этом энергопотребление значительно ниже.
Создание больших ферм на ASIC-оборудовании негативно влияет на блокчейн, так как значительно уменьшает уровень децентрализации. А децентрализация необходима для надежности криптовалюты. С помощью равномерной рассредоточенности узлов блокчейна и многократному дублированию файлов платформы, получается создать систему, которая будет невосприимчива к блокировке, удалению, изменению и хакерским атакам.
В итоге, появление ASIC-устройств вынудило пользователей, у которых нет достаточного капитала для их покупки, перестать майнить Bitcoin. По прогнозам некоторых аналитиков, в скором времени Bitcoin будут майнить только крупные ASIC-фермы, что приведет к централизации.
Как уже было сказано выше, алгоритм Ethash создавался с целью предотвратить появление ASIC-устройств для майнинга на этом алгоритме. Но в начале 2018 года компания Bitmain анонсировала выпуск первых ASIC-устройств для Ethash. Однако Ethereum решительно выступил против перспективы доминирования этих устройств в их сети, что привело к разговору о “брикетировании” этого оборудования. Брикетирование это технологическое обновление сети, которое делает аппаратное обеспечение бесполезным или даже сломанным, если оно подключено к сети. Из-за этого майнеры на таком оборудование были вынуждены скрыть свое присутствие и снизить мощность хеширования своих устройств. Также план Ethereum по переходу на технологию PoW/PoS (гибрид Proof of Work и Proof of Stake) c просто PoW делает разработку ASIC устройств для Ethash очень рискованным для производителей.
Принцип работы алгоритма Ethash
В основе Ethash лежит особый граф, состоящий из последовательных узлов. Граф можно представить в виде своеобразного дерева, обладающего большим числом ответвлений. Эта особенность заметно усложняет создание ASIC-устройств для работы с этим алгоритмом. Поэтому для майнинга монет, основанных на Ethash, можно применять лишь видеокарты.
В начале процесса майнинга на память видеокарт загружается специальный DAG файл. Размер этого файла постоянно увеличивается и чем больше существует криптовалюта, тем размер большое. Поэтому необходимо помнить, что чем объемнее DAG файл, тем более мощная видеокарта нужна для добычи этой криптовалюты.
Размер DAG-файла увеличивается каждый раз, когда создаются новые 30000 блоков. На данный момент размер DAG файла для Ethereum около 3,5 Гб. Это означает, что скоро видеокарты на 4 Гб не смогут заниматься майнингом этой монеты. Еще более печальная ситуация была у Ethereum classic, когда размер DAG приблизился к 3,96 Гб. В тот момент было принято решения уменьшить размер файла до ~2,5 Гб. Это было необходимо сделать, так как большая часть майнеров использовала видеокарты на 4 Гб и, соответственно, они бы не смогли майнить, что привело бы к централизации майнинга у крупных игроков и уменьшению надежности криптовалюты.
Теперь перейду к описанию алгоритма хэширования Ethash:
Процесс состоит из 6 основных этапов:
На вход алгоритму подается препроцессированый заголовок, полученный из последнего блока и “nonce”. “Nonce” число, выбранное случайным или псевдослучайным образом. Это подается на SHA-3 подобную функцию, которая создает 128 байтный микс.
Далее этот микс используется для того, чтобы определить какую 128-байтную страницу из DAG нужно извлечь.
Полученная страница сочетается с миксом с помощью специальной функции смешивания
2 и 3 шаг повторяется 64 раза
Полученный в итоге микс обрабатывается для получения более короткого 32-байтного дайджест микса.
В конце дайджест микс сравнивается с целевым порогом. Если дайджест микс меньше или равен порогу, то “nonce” считается успешным и транслируется в сеть Ethereum. Если же дайджест микс больше порога, то выбирается новый “nonce” путем рандомного выбора или прибавлением единицы к старому “nonce”. И потом алгоритм перезапускается с новым значением “nonce”.
Майнинг с помощью алгоритма Ethash
Майнинг на алгоритме Ethash можно производить как на CPU, так и на GPU. Однако, майнинг на CPU практически не приносит прибыли, так как GPU гораздо эффективнее. Также я упоминал про майнинг на ASIC-устройствах и FPGA, которые в настоящее время способны к интеллектуальному анализу Ethash, однако они неэффективны по сравнению с графическими процессорами и не приветствуются как сообществом, так и разработчиками. Поэтому наиболее выгодным является майнинг на GPU.
Ethash занимает мало памяти, однако требует не менее 2-3 ГБ ОЗУ на каждый используемый графический процессор. GPU от компании AMD обычно показывают лучшие результаты, чем GPU от компании Nvidia. Для того чтобы начать майнить, необходимо скачать специальную программу, например Ethminer.
Майнинг в пуле также очень популярный способ добычи криптовалют. Он позволяет людям с низкими вычислительными мощностями участвовать в майнинге и получать с этого какую то прибыль. За это создатели пулов берут какой-то процент, обычно в районе 1-2% от дохода.
Далее сравним основные способы майнинга:
Способ | Суть | Минусы | Плюсы |
Самостоятельный майнинг | Майнер приобретает оборудование самостоятельно | 1. Затраты на видеокарты 2. Шум от оборудования 3. Самостоятельный сбор и настройка фермы 4. Затраты на электроэнергию 5. Риск поломки оборудования | Майнер получает все деньги |
Майнинг через пул | Майнер приобретает оборудование самостоятельно и подключается к пулу | 1. Затраты на видеокарты 2. Шум от оборудования 3. Самостоятельный сбор и настройка фермы 4. Затраты на электроэнергию 5. Риск поломки оборудования | Есть разные схему распределения прибыли, однако чаще всего это выгоднее чем самостоятельный майнинг |
Облачный майнинг | Майнер арендует вычислительные мощности | 1. Плата за аренду | Нет минусов связанных с покупкой, настройкой и обслуживанием оборудования. |
Монеты на основе алгоритма Ethash
В настоящее время алгоритм Ethash используется во многих криптовалютах. Но самым популярными из них являются:
Ethereum
Ethereum Classic
Expanse
Ubiq
Далее мы более подробно рассмотрим каждую из них:
Ethereum. Это вторая по популярности криптовалюта после Bitcoin. Ее капитализация составляет 67,5 млрд $, что сопоставимо с капитализацией Газпрома. Одним из основателей является выходец из Коломны Виталик Бутерин. Эта платформа позволяет создавать собственные токены, создавать и применять умные контракты и собственные децентрализованные онлайн сервисы и приложения.
Ethereum Classic. Эта криптовалюта появилась в результате несогласия некоторых пользователей с хард-форком оригинального Ethereum. Он произошел из-за того, что один хакер нашел уязвимость и воспользовался ею, чтобы украсть около 50 млн $. Разработчики в свою очередь выпустили обновление, убирающее эту уязвимость, а также позволившее вернуть украденные деньги владельцам. Часть людей посчитало, что злоумышленник не нарушал никаких правил. А так как платформа является децентрализованной, то никто не имеет право вносить в нее изменения. И поэтому они высказались против обновления. И в итоге это привело к созданию Ethereum Classic.
Expanse. Появление этой криптовалюты произошло в 2015 году из-за форка Ethereum. Эта криптовалюта является платежным средством на децентрализованной платформе Expanse Tech, которая создавалась для создания онлайн сервисов. Эта криптовалюта уникальна тем, что все решения о развитие сети принимаются только участниками путем голосования. Если большинство решит, что обновление плохое, то его отменят.
Ubiq. Эта криптовалюта появилась в результате очередного форка Ethereum в 2017 году. Команда разработчиков совершенствует исходный код для того, чтобы криптовалюта обладала более высоким уровнем гибкости и надежности, по сравнению с Ethereum. Платформа была создана для того, чтобы создать среду защищенную от форков для частного использования, так и для бизнеса. Однако у многих аналитиков есть сомнения в полезности этой криптовалюты, так как она не несет в себе ничего нового.
Заключение
Сегодня много различных криптовалют основаны на алгоритме Ethash. Это объясняется рядом причин. Во-первых, код алгоритма находится в свободном доступе. Во-вторых, она позволяет предотвратить или сильно уменьшить возможности создания ASIC-устройств для него, что в свою очередь позволяет сделать платформу децентрализованной. Из-за этого она более надежна и позволяет зарабатывать на майнинге не только крупным игрокам, но и рядовым пользователям. Однако есть и ограничения, связанные с высокими требованиями к оперативной памяти для графического процессора.
Список источников:
http://promining.su/kriptovalyuty-na-ethash/
https://altcoinlog.com/algoritm-ethash-dagger-hashimoto/#i-3
https://crypta.guru/kriptovalyuty/algoritm-ethash/
https://cryptomagic.ru/kriptovaluty/ethereum/algoritm.html
https://eth.wiki/en/concepts/ethash/ethash/
Майнить биткоины стало сложнее: Криптовалюта: Экономика: Lenta.ru
Корректировка алгоритма добычи биткоина привела к усложнению процесса майнинга главной криптовалюты мира. Об этом сообщает CNBC.
Обновление алгоритма происходит каждые 2016 блоков, что равносильно примерно двум неделям вычислений. Процесс независим от рынка, а усложнение или упрощение майнинга (хешрейт) зависит от вычислительных мощностей, которые задействованы в системе. В пятницу, 13 августа, система автоматически обновила сложность вычислений на 7,3 процента. Эксперты рынка отмечают, что резкий рост сложности вычислений был ожидаем, так как в сеть возвращаются мощности, которые ушли в офлайн после запрета на майнинг в Китае в мае 2021 года.
Аналитик консалтинговой компании Quantum Economics Джейсон Дин заявил, что уровни хешрейта по-прежнему на 42,1 процента ниже пика, который пришелся на май 2021 года, когда Китай, на долю которого приходилось 54 процента от общего хешрейта биткоина, отключился от сети. Меньшее количество людей в сети и меньшая вычислительная мощность означали, что на проверку транзакций и майнинг новых биткоинов уходило больше времени. Тем не менее, по словам инженера по добыче биткоинов Брэндона Арванаги, в сети не было никакого простоя. Алгоритм самокорректировал это отклонение от нормы, и в июле сеть увидела абсолютно беспрецедентное снижение уровня сложности на 28 процентов.
Майк Колайер, генеральный директор занимающейся цифровой валютой компании Foundry, заявил, что в июле наблюдалось «дно» падения хешрейта, после которого начался стремительный рост — майнеры стали наращивать мощности и подключают новые машины.
Участники рынка предсказывают, что большая часть оборудования старого поколения никогда не вернется в режим онлайн. По словам генерального директора и основателя поставщика услуг по добыче биткоинов Compass Уита Гиббса, новые машины имеют значительно более высокий хешрейт, чем их предшественники. Рост эффективности добычи биткоинов приведет к росту конкуренции среди майнеров, что вернет хешрейт на пиковые значение уже в ближайшие 12 месяцев.
Алгоритм майнинга криптовалют: обзор основных алгоритмов хеширования
Алгоритм майнинга, или алгоритм хеширования необходим для расшифровки данных в криптовалютной сети и определения их достоверности. Разработкой алгоритмов занимаются специалисты-криптографы. Схема основана на обработке «хэша» – это число, зашифрованное из строки содержимого. Невозможно зашифровать две строки таким образом, чтобы получился одинаковый хэш.
Основная идея майнинга Биткоина заключается в том, что майнеры заключают некоторую группу свежих транзакций в единый блок, а потом множество раз выполняют вычислительную операцию хеширования, пока кто-то из них не обнаружит нужное число. После этого транзакции можно считать подтвержденными.
Содержание статьи
Алгоритм майнинга криптовалют: что это и зачем нужен
В криптографии существует понятие хэш-функции, она отвечает за зашифровку данных, которые впоследствии расшифровывает алгоритм майнинга криптовалют. Хэш-функция устроена так, что нет «легкого пути» получить нужный результат – можно только раз за разом подбирать значения, пока не найдется одно работающее.
В Биткоине успешным хэшем считается тот, который начинается с определенного числа нулей. Сложность нахождения растет экспоненциально. На текущий момент в числе должно быть 17 нулей подряд, чтобы оно было признано подходящим. Таким образом, только один из 1.4×1020 чисел приведет к успешному результату. Найти хэш даже труднее, чем одну песчинку из всех существующих на Земле.
Посмотрите видео, которое объясняет, что такое алгоритм хеширования (включите субтитры и перевод на русский):
Алгоритм майнинга топовых криптовалют
Список популярных и перспективных криптовалют, доступных для майнинга, и их алгоритмы хеширования:
Основные алгоритмы майнинга криптовалют
Рассмотрим наиболее распространенные на сегодняшний день алгоритмы майнинга.
SHA-256
Сокращение SHA расшифровывается как «безопасный расчет хеша». Этот вычислительный метод обеспечивает неизменность информации в криптографическом наборе данных. Информация зашифрована или закодирована, поэтому находится в безопасности, и получить доступ могут только те люди, у которых есть код.
В 2001 году американское Агентство Национальной Безопасности разработало алгоритм SHA-2. SHA-256 – его разновидность. Название обусловлено тем, что он работает с числами размером 256 бит. Иными словами, конкретный бит данных кодируется и трансформируется в код из 256 фрагментов. Время обработки кода в SHA-256 занимает 6-10 минут.
Scrypt
В алгоритме хеширования Scrypt используется сразу 11 логических протоколов для подтверждения работы (PoW). Самое крупное преимущество применения Scrypt – эффективность, так как с ним оборудование потребляет на 30% меньше мощности и требует меньше охлаждения.
Многоуровневое вычисление начинается с загрузки информации с помощью хеш-процесса SHA-256. В это время рассчитывается анализ структуры связей, без которого невозможно завершение хеширования. Если сравнивать с SHA-256, то Scrypt потребляет меньше энергии, но значительно больше памяти. Также в Scrypt существует возможность уменьшить размер хеша, из-за чего вычисление осуществляется быстрее.
Ethash
Ethash был разработан специально для Ethereum с целью снизить уязвимость перед ASIC-майнерами. Алгоритм основан на интеллектуальном анализе данных. Ранее Эфир применял алгоритм под названием Dagger-Hashimoto, а Ethash по сути его обновленная и улучшенная версия.
Был сделан сильный упор на защиту от ASIC, однако это помогло ненадолго – интерес производителей асиков к Эфириуму возрос, и вскоре такие устройства все же были выпущены на рынок, что вызвало возмущения в сообществе. Было предложено даже «банить» слишком мощные устройства, подключенные к сети.
X11
Алгоритм X11 был разработан в 2014 году и также как Ethash был нужен для противодействия асик-майнерам и сохранения конкурентоспособности владельцев видеокарт и процессоров. X11 работает одновременно с 11 разными хеш-функциями. Сначала первая функция создает хеш, затем передает эстафету второй и так далее.
Все одиннадцать алгоритмов, входящих в состав X11, были введены в работу Национальным институтом стандартов и технологий США, чтобы разработать новую функцию SHA-3 с повышенной безопасностью по сравнению с предшественниками. Кандидатов было 64, конкурс прошли только 11.
CryptoNight
CryptoNight – алгоритм майнинга, предназначенный для применения на обыкновенных процессорах. Изначально алгоритм закодирован в базе кода CryptoNote. Cryptonight берет информацию объемом 2 Мб, извлекает базовые данные, смешивает их с последовательными и дает на выходе идеальный результат.
Основным преимуществом протокола считается возможность дополнительного микширования. Транзакции таким образом становятся более конфиденциальными. CryptoNight используют многие криптовалюты, из которых наиболее известна Monero.
Equihash
Этот алгоритм майнинга криптовалют представляет собой асимметричную систему Proof-of-Work, ориентированную главным образом на память. Количество работы, которую может произвести устройство при работе с этим алгоритмом, определяется в основном количеством оперативной памяти, которым оно оснащено.
Алгоритм Equihash называют устойчивым к ASIC-майнерам. Память – дорогостоящий вычислительный ресурс, и поэтому ее оптимизация на асик-чипе будет дорогостоящим и невыгодным для пользователя процессом. В результате процесс майнинга на ASIC станет менее эффективным и мощным.
Decred
Криптовалюта Decred использует гибридный механизм консенсуса, сочетающий в себе принципы PoS и PoW. Такая система гарантирует, что развитие проекта на может зависеть от контроля сильных заинтересованных групп, а также в блокчейн на могут вноситься изменения без согласия сообщества.
PoW в Decred подразумевает вознаграждение в 30 монет за добытый блок, которые разделяются между майнерами, голосующими и фондом развития проекта. Далее голосующие могут отдавать свои голоса за или против предлагаемых корректировок в цепи. За то, что они защищают сеть хранением своих ставок, им отдается 30% дохода с каждого сформированного блока.
Quark
Quark – алгоритм майнинга криптовалют, базирующийся на хэш-функции с девятью уровнями шифрования. Алгоритм не требует большого количества ОЗУ, а также содержит в себе встроенную защиту от хакерских атак высокого уровня (64 бит). Отличается малым потреблением энергии. Quark разработали в 2013 году и внедрили в него шесть функций для шифрования: Grostl, Blake, Keccak и т.д.
Алгоритм Quark используется в механизмах консенсуса PoS и PoW, чтобы поддержание рабочего состояния криптовалютной системы было более определенным и безопасным. По сравнению со SHA-256, используемым в Биткоин, Quark обладает устойчивостью к возникновению SPOF (единой точки отказа), из-за которой может выйти из строя вся система.
X15
X15 основан на X11, только вместо применения 11 функций хеширования в нем используется 15. За счет такого хода существенно повышается устойчивость к хакерским атакам. Если хакер взломает одну из пятнадцати функций, то разработчики тотчас же усовершенствуют ее, чтобы система продолжала оставаться в безопасности. Злоумышленнику, желающему взломать всю систему, необходимо будет поочередно пройти через все 15 функций, и сделать это быстро.
SHA-2
Безопасный алгоритм хэширования, на основе которого разработано не менее десяти усовершенствованный вариантов, в том числе SHA-256. Все хэш-функции, применяемые в семействе, основаны на структуре Меркла-Дамгора.
Суть заключается в том, что исходная информация разделяется на блоки после дополнения, а затем каждый из блоков делится на шестнадцать слов. Далее каждый блок сообщения пропускается через цикл, состоящий из 80 или 64 раундов перемешивается. На каждом этапе два слова трансформируются, а функция этой трансформации задается остальными 14-ю словами.
Cuckoo Cycle
Cuckoo Cycle – один из самых перспективных на сегодняшний день алгоритмов, устойчивых к ASIC. Изначально был изобретен для защиты от спама в электронной почте. Однако архитектура оказалась вполне подходящей для добычи криптовалют на графических процессорах. Сфокусирован в основном на использовании памяти, поэтому требует значительно меньше вычислительной энергии, чем другие PoW-алгоритмы. Следовательно, снижаются и затраты на охлаждение.
Другие алгоритмы
Также встречаются следующие виды алгоритмов майнинга криптовалют:
- SHA-3 (Keccak). Протокол основывается на конструкции Sponge. Чтобы получить хэш, берется исходная информация, после чего дополняется до длины, кратной R. К сообщению добавляется байт, некоторое число нулей и завершающий байт, обладающий значением 0x Затем, для получения нужного числа, к полученным данным неоднократно применяется хеш-функция.
- Blake. Состоит из трех основных компонентов – внутренней структуры, гарантирующей защиту от коллизий, режима итерации, противодействующего внешним атакам, и алгоритма сжатия. В результате получается тщательно проанализированная безопасная функция.
- Lyra2RE. Был разработан как замена устаревшего Scrypt-N algo для криптовалюты Vertcoin. Основная цель – снижение энергопотребления в процессе добычи токенов. Алгоритм успешно сменился в середине 2014 года.
Заключение
Чаще всего, когда речь заходит о майнинге криптовалют, то имеется в виду алгоритм SHA-256 или Scrypt, потому что на сегодняшний день они используются наиболее часто. Но знать об остальных вариантах тоже полезно и интересно, если вы хотите быть в курсе того, что происходит сейчас в криптовалютной отрасли.
Trade-to-Mine – революционный алгоритм майнинга криптовалюты
На данный момент существует два основных метода майнинга криптовалют. Большинство валют использует алгоритмы PoW и PoS и их изменённые и улучшенные варианты. Например, Proof-of-Importance (PoI), который является разновидностью PoS. Два основных варианта, используемые в большинстве случаев, предусматривают высокоэффективный майнинг, в отличие от того же PoI, в котором майнинг возможен только в виде комиссий за переводы в сети.
Заработок на криптовалюте путём майнинга был одной из основных причин роста интереса по отношению к цифровой валюте. Поэтому всё больше разработчиков в сфере блокчейн пытается создать новые революционные алгоритмы, позволяющие привлечь сообщество к их проектам. Частью таких проектов являются криптовалютные биржи, занимающие существенное место в развитии крипторынка. Но классические алгоритмы не подходят для воплощения целей, вызванных растущими требованиями к их функционированию и использованию.
Появление алгоритма Trade-to-Mine (ToM)
Данный алгоритм получил широкое распространение совсем недавно, но мало кто знает, что он был создан достаточно давно. Ещё в апреле 2018 года на рынок вышла китайская биржа FCoin, которая создала свой собственный токен FCoin Token. Используя его, биржа показала сообществу принципиально новый способ добычи криптовалюты под названием «Trans-fee-mining».
Новый алгоритм стал активно обсуждаться сообществом. Многие считали его перспективным способом, позволяющим составить конкуренцию привычным, достаточно дорогим методам майнинга. Но одновременно с этим эксперты выявили серьёзные недостатки алгоритма, способные влиять на сеть других криптовалют.
Идея подобного майнинга получила дальнейшее распространение. Недавно появилась новая сингапурская биржа ABCC, которая использует в своей основе этот способ добычи токенов, учитывая нюансы, выявленные в ходе появления такого метода.
Принцип работы
В основе метода Trade-to-Mine лежит алгоритм, в ходе которого комиссии от совершения сделок на платформе распределяются среди пользователей в виде токенов биржи. Таким образом, при проведении транзакций пользователи майнят токены. Работу данного способа можно проследить на бирже ABCC, которая в последнее время пользуется популярностью среди сообщества. Там этот способ перенёс некоторые изменения.
На бирже используется токен AT. Механизм создания AT похож на тот, который работает в сети Bitcoin. Каждый новый блок генерируется 4 раза в день и содержит в себе фиксированное количество токенов. Через каждые 480 блоков число токенов будет уменьшаться в 2 раза. Количество AT, которое получит пользователь, напрямую зависит от объёма его торгов. Всего будет выпущено 210 миллионов AT. 51% будет распространён среди сообщества, а 49% останутся во владении команды.
Пользователи получают преимущество не только путём зарабатывания монет за торговлю на платформе. Владельцы AT также получают бонус за хранение токенов на кошельке в виде распределения среди держателей 80% от всех комиссий. На платформе реализована реферальная программа, которая позволяет получать количество дополнительных AT, пропорциональное объёму торгов человека, присоединившегося к платформе по реферальной ссылке. Реферальная система имеет два уровня, так что участник, пригласивший пользователя, получает вознаграждение и за торговые операции тех людей, которых пригласил этот пользователь.
В целом, подобный алгоритм является выгодным как для пользователей, так и для бирж. Ведь посредством такого майнинга биржа получает успешную модель распределения своих токенов и приток новых пользователей.
Недостатки алгоритма
Однако, несмотря на все положительные стороны, данная модель майнинга обладает рядом существенных недостатков:
- Использование схемы Trade-to-Mine привело к распространению большого числа торговых роботов и бесполезных спам-сделок.
- Данный способ майнинга способен привести к увеличению комиссий в сетях крупных валют, таких как Ethereum и Bitcoin. Похожая ситуация, связанная с перегруженностью сети Ethereum, произошла, когда впервые был применён подобный алгоритм биржей FCoin.
- Эксперты проводят аналогию между методом ToM и ICO, называя данный метод майнинга «простой покупкой токенов биржи за BTC и ETH». А значит, рано или поздно, это приведёт к обесцениванию валюты, которая не подкреплена продуктом.
- Биржа, выпустившая токен, может манипулировать его ценой. По факту, если биржа не получает прибыли от транзакций пользователя, то для своего развития ей придётся производить подобные манипуляции.
- Торговля токенами происходит только на бирже-создателе. За её пределами они не имеют ценности и способны обесцениться в любой момент.
На данный момент пользователи активно используют возможность получить прибыль с помощью нового алгоритма. Небольшое число людей задумывается о негативных эффектах, вызываемых им. Для бирж это крайне выгодный способ увеличить объём торгов и повысить собственную популярность. По прогнозам экспертов, алгоритм ToM будет востребован среди пользователей ещё длительное время до наступления негативных событий, указанных выше.
Алгоритмы майнинга криптовалют — таблица 2020 описание
Содержание статьи:
- Что такое алгоритм криптовалют?
- Таблица алгоритмов криптовалют
- Алгоритмы шифрования и их криптовалюты
В каждой криптовалюте используется некий алгоритм шифрования. Его расшифровывают майнеры, гарантируя функционирование блокчейна и получая за это вознаграждения. Какие алгоритмы майнинга используются в Bitcoin, Ethereum, Litecoin, Monero, Dash и других криптовалютах и в чем заключаются их особенности? Команда https://exchangesumo.com решила ответить на эти и другие вопросы.
Что такое алгоритм криптовалют?
Криптографические валюты разработаны как платежные инструменты, которые гарантируют анонимные и безопасные транзакции. Это достигается путем децентрализованной проверки операций, проводимой множеством узлов связи при майнинге. При этом количество монет, адреса кошельков и другая информация шифруется в своеобразное сообщение – хеш. Оно представляет собой строку из набора символов и меньше текста.
Алгоритм криптовалют, который выступает набором криптографических механизмов и правил, трансформирует текст произвольной длины в хеш фиксированной длины. А вот майнеры с помощью специального оборудования расшифровывают его. После нахождения хеша в блокчейне генерируется новый блок, в который записывается информация о транзакциях, вознаграждении майнера, хеше предыдущего блока и так далее.
Таким образом, процесс дешифровки (добычи цифровых денег) превращает набор случайных сведений в упорядоченную систематизированную информацию, которая записывается в блокчейн.
Сегодня насчитывается пара десятков алгоритмов майнинга криптовалют – Scrypt, Equihash, Ethash (Dagger Hashimoto), ECDSA, Blake256, NeoScrypt, Lyra2RE, Pascal, WhirlpoolX, Qubit…
Однако одного шифрования для построения надежного блокчейна недостаточно. Поскольку добавлять записи может каждый участник сети, этот процесс требует проверки. Для этого применяются специальные доказательства достижения консенсуса. Это те подтверждения, которых ждет пользователь при отправке новой транзакции.
Самые популярные алгоритмы достижения консенсуса в блокчейне – Proof-of-Work и Proof-of-Stake. Первый термин переводится как «доказательство работы». Он представляет собой механизм проверки того, что работа (вычисления, майнинг) выполнена.
PoS – это доказательство владения. Этот механизм дает право генерировать блоки только тем узлам сети, которые имеют валюту на счете. Количество монет увеличивает вероятность того, что генерация произойдет.
Таблица алгоритмов криптовалют
Какие криптовалюты на каких алгоритмах работают? Представим эту информацию в виде таблицы:
Криптовалюта | Алгоритм шифрования | Алгоритм консенсуса |
Bitcoin | SHA-256 | PoW |
Ethereum | Ethash | PoW |
Bitcoin Cash | SHA-256 | PoW |
Ripple | ECDSA | RPCA |
EOS | SHA-256 + ECDSA | DPoS |
Stellar | Ed25519 | SCP |
Cardano | Ed25519 | PoS |
Litecoin | Scrypt | PoW |
Monero | CryptoNight | PoW |
Dash | X11 | PoA |
Ethereum Classic | Ethash | PoW |
Decred | Blake256 | PoW, PoS |
NEO | SHA-256 + RIPEMD160 | PoW |
ZCash | Equihash | PoW |
Lisk | Ed25519 | PoS |
Dogecoin | Scrypt | PoW |
Bytecoin | CryptoNight | PoW |
Steem | SHA-256 | PoW, PoS |
Siacoin | Blake2b | PoW |
Vertcoin | Lyra2REv2 | PoW |
DigiByte | Groestl, Skein, Qubit, Scrypt и Sha256 | PoW |
Komodo | Equihash | DPoW |
Electroneum | CryptoNight | PoW |
Diamond | Groestl | PoW, PoS |
Monacoin | Lyra2REv2 | PoW |
Stratis | X13 | PoS |
NEM | Catapult | PoI |
ICON | LFT | DPoS |
Verge | Scrypt, X17, Groestl, Blake2s, Lyra2rev2 | PoW |
Если ищите крипту для инвестирования в 2020 году, ознакомьтесь с этой статьей. Способы заработка на коинах описаны здесь.
Алгоритмы шифрования и их криптовалюты
Теперь давайте узнаем, что представляют из себя популярные алгоритмы майнинга криптовалют.
SHA-256
Технология изобретена в 2001 году Агентством национальной безопасности США. Изначально она применялась для шифрования конфиденциальной информации в протоколах TLS, SSL, SSH и PGP. Однако всемирно известным алгоритм стал только благодаря криптовалютной платформе Bitcoin. Также он используется в следующих монетах:
- Bitcoin Cash;
- Bitcoin SV;
- Litecoin Cash;
- Peercoin;
- Namecoin;
- Emercoin;
- DigiByte;
- Unobtanium;
- ZetaCoin и других.
Аббревиатура SHA расшифровывается как Secure Hash Algorithm (безопасный алгоритм хеширования). А вот 256 означает, что технология работает с числами размером 256 бит. Иными словами, механизм создает уникальный 256-битный хеш-код из исходной строки текста.
Это единственный алгоритм в своем семействе, который прошел тест на устойчивость к атакам «нахождение прообраза» и «нахождение коллизий». Время обработки блока здесь составляет 6 – 10 минут. Хешрейт для криптовалют, работающих на SHA-256, вычисляется в Gigahash в секунду (GH/s).
В 2009 году, когда о Биткоине знал малый круг лиц, для расшифровки алгоритма хватало персонального компьютера, который выполнял вычисления с помощью центрального процессора (CPU). С ростом популярности криптовалюты возрастали и требования к оборудованию. Сегодня для майнинга Биткоина выгодно использовать только ASIC-майнеры – специальные устройства, обладающие вычислительной мощностью десятка, а то и сотен ПК (к примеру, Bitmain Antminer S9).
О том, как увеличить прибыльность добычи, смотрите в следующем видео:
Scrypt
Вскоре стало ясно, что простота вышеуказанной технологии разрешает автоматизировать майнинг, то есть добычу Bitcoin можно легко монополизировать. Поэтому требовался более сложный механизм генерации блоков. Таковым стал Scrypt. В этой технологии предъявляются повышенные требования к ресурсам, применяемым для вычислительных операций. Главную роль здесь играет объем ОЗУ. Причем, если ее недостаточно, скорость создания подписи стремительно снижается. А вот требования к вычислительной мощности и энергопотреблению ниже, чем у предыдущего алгоритма майнинга.
Скорость создания блоков в блокчейне, работающем на алгоритме Скрипт, составляет порядка 30 секунд. Хешрейт измеряется в Megahash в секунду (MH/s).
Технология стала популярной, в первую очередь, благодаря ее применению в Litecoin. Также на этом алгоритме работают следующие криптовалютные платформы:
- Dogecoin;
- Verge;
- MonaCoin;
- Viacoin;
- Syscoin;
- MoonCoin;
- GoldCoin;
- Gulden и другие.
Изначально для расшифровки алгоритма применялись центральные процессоры и видеокарты. Однако он не смог противостоять майнинг-корпорациям. Поэтому в 2014 году был создан первый асик для Скрипт. Позже появилась усовершенствованная технология Scrypt-N. Ее особенность – постоянный рост требований к оперативной памяти.
Программы для майнинга – CudaMiner, CGminer, SGminer…
Equihash
Технологию шифрования Equihash создали Александр Бирюков и Дмитрий Ховратович – ученые Университета Люксембурга, входящие в исследовательскую группу CryptoLUX. Собственный проект они представили в 2016 году. Впервые технология была использована в монете Zcash. Также в список криптографических валют, использующих алгоритм майнинга Equihash, включены:
- Bitcoin Gold;
- Bitcoin Private;
- Komodo;
- ZClassic;
- Hush;
- Zero;
- MinexCoin;
- BitcoinZ и другие.
Реализованная здесь хеш-функция применяет концепцию «Парадокса дней рождений». Она доказывает вероятность того, что в группе из 23 людей найдется хотя бы одна пара с одинаковой датой рождения, составляет свыше 50%. А если в группе больше 60 человек, такая вероятность превышает 99%. Есть формула, доказывающая достоверность этого утверждения. На ее основе и построен метод шифрования Equihash – вероятность нахождения нужного хеш-кода майнерами равна 2 в степени N/2.
На создание блоков уходит 150 секунд. Хешрейт измеряется в Megahash в секунду (MH/s).
Алгоритм майнинга криптовалют Equihash требователен к объему ОЗУ, а не к скорости обработки вычислений. Это делает сеть более децентрализованной, а добычу монет – айсикоустойчивой. Для майнинга используются видеокарты с объемом памяти от 2 Гб. Самые результативные графические процессоры производителя NVidia. Тем не менее, есть и специальные ASIC-устройства. Популярны две системы – Antminer Z9 mini от Bitmain и A9 ZMaster от Innosilicon.
Ethash (Dagger Hashimoto)
Ethash представляет собой алгоритм, созданный специально для майнинга криптовалюты Ethereum. Позже его стали использовать и другие платформы:
- Ethereum Classic;
- Ubiq;
- QuarkChain;
- Metaverse;
- Expanse;
- Pirl;
- Ellaism;
- Elementrem и так далее.
В основу работы Ethash положены два алгоритма шифрования криптовалют – Dagger и Hashimoto. Первый создал Виталик Бутерин, а второй – Тадеуш (Тадж) Драйя.
Алгоритм майнинга Dagger требователен к памяти видеокарт. Принцип его действия похож на Scrypt, но производительность здесь выше, что сильно ощутимо при повышении сложности сети. В Dagger присутствуют уязвимости, поэтому он и используется вместе с Hashimoto.
Система Hashimoto работает с операциями ввода, вывода в особом режиме. Она, к примеру, ограничивает скорость майнинга, поскольку количество памяти для записи и считывания информации не бесконечно. Эта технология не разрешает выполнять много операций ввода, вывода, то есть для расшифровки нельзя применять метод бесконечного подбора случайных значений.
Для майнинга монет, построенных на алгоритме Ethash, требуется вычислительная мощность видеокарт. Самыми результативными считаются устройства от AMD. Выгодны и видеокарты NVidia 10-й серии.
В Ethash сделан сильный упор на защиту от асик. Однако противостояние длилось недолго. Так, в 2018 году Bitmain представил асик для Ethereum.
X11
Создателем этого алгоритма выступает Эван Даффилд. Он поставил под сомнение надежность SHA-256. Из-за простоты этой технологии большинство монет может оказаться в руках нескольких влиятельных пулов, что приведет к резкому ценовому обвалу. Кроме того, было отмечено, что с таким алгоритмом система не защищена от взломов в полной мере.
Технология X11 появилась в 2014 году. Эван Даффилд утверждает, что на ее создание ушли только одни выходные. Механизм работает одновременно с 11 хеш-функциями. Сначала первая создает хеш, затем передает эстафету второй и так далее. Все 11 алгоритмов введены в работу Национальным институтом стандартов и технологий США, чтобы создать новую хеш-функцию SHA-3 с повышенной безопасностью. Кандидатов было 64, но конкурс прошли только 11 – Blake, Skein, Blue midnight wish, Luffa, Keccak и другие.
Взломать систему 11-раундового хеширования практически невозможно. Кроме того, технология экономна в плане потребления энергоресурсов. Добыча валют на алгоритме X11 потребляет на 30 – 50% меньше электроэнергии, чем майнинг Биткоина на ASIC-устройствах.
Для добычи подходят GPU и CPU. Также сегодня уже есть асик для этой технологии. Подходящие программы – sph-sgminer_x11mod и ccminer.
На алгоритме X11 работают следующие криптовалютные платформы:
- Dash;
- Enigma;
- Boolberry;
- Synergy;
- DigitalCoin;
- MonetaryUnit;
- CannabisCoin;
- Onix;
- Adzcoin и другие.
По примеру этого механизма разработаны и другие алгоритмы, которые также построены на интеграции ряда хеш-функций. Речь идет о X12, X13, X14, X15, X16 и X17. Однако рассматриваемый механизм остается самым популярным.
CryptoNight
Главной особенностью Криптонайт считается повышенная конфиденциальность. Этот алгоритм стал известен, в первую очередь, благодаря монете Monero. Также на нем построены:
- Bytecoin;
- Electroneum;
- DigitalNote;
- Aeon;
- Sumokoin и другие монеты.
Высокая степень анонимности технологии достигается благодаря использованию кольцевых подписей, которые скрывают отправителей, и одноразовых адресов получателей. Наличие подписи подтверждает только то, что транзакцию выполнил кто-то из участников группы, но отличить их друг от друга невозможно.
Монеты, построенные на этом алгоритме, взаимозаменяемы. Это значит, что у них нет «темного прошлого», как, например, у Биткоина, блокчейн которого разрешает отслеживать движение каждого коина и его участие в «грязных делах».
CryptoNight требователен к ОЗУ (нужно как минимум 2 Гб), а не к скорости проведения вычислений. Для майнинга выгодно использовать CPU в паре с GPU. Однако добыча только на центральных процессорах также результативна. Monero ежегодно вносит изменения в протокол, чтобы защититься от асик. А вот другие монеты на этом алгоритме майнинга без проблем добываются с помощью такого оборудования. Это может быть Antminer X3, PinIdea RR-200, Baikal Giant-N… Подходящие miner – Claymore’s CryptoNote, Cast XMR, XMR-Stak и другие.
Lyra2Z
Разработчиками Lyra2Z выступают создатели другого популярного алгоритма Equihash – Александр Бирюков и Дмитрий Ховратович. Главная задача этой технологии – недопущение возникновения монополий больших дата-центров в майнинге. Она отмечена специальной премией во время конкурса Password Hashing Competition в ноябре 2015 года.
Lyra2Z объединяет преимущества Blake256 и Lyra2. От первого алгоритм взял:
- атакоустойчивость;
- упрощенный хеш-интерфейс;
- высокую скорость обработки информации;
- высокую степень безопасности информации;
- возможность изменения базовых настроек.
От Lyra2 взяты следующие преимущества:
- высокая энергоэффективность;
- минимальные требования к вычислительному оборудованию.
За счет энергоэффективности, алгоритм хеширования Lyra2Z считается самым «холодным». С ним легче охлаждать майнинговое оборудование. К примеру, температура процессора видеокарты GTX 1060 при 23 градусах не превышает 46 – 48 градусов по Цельсию.
Lyra2Z используют Zcoin, GINcoin, Master Contract Token и другие платформы.
Программы для этой технологии – SGminer, Tourgasm ccminer, Nemos Miner…
Scrypt-Jane
Алгоритм Scrypt-Jane поддерживает 3 механизма шифрования, названных в честь латиноамериканских танцев:
- Salsa20 – его главная задача заключается в приеме 192-байтной строки и ее преобразовании в 64-байтную. Не в последнюю очередь это происходит благодаря внутреннему алгоритму сжатия Rumba20.
- ChaCha20 – еще один потоковый шифр, который предлагает дополнительные услуги. К примеру, повышенную устойчивость к криптоанализу или улучшенное перемещение информации на каждый раунд.
- Salsa6420/8 – улучшенный вариант Salsa20, работающий с высокобайтными блоками информации.
Scrypt-Jane разработан для узконаправленного майнинга с применением только центральных процессоров. Однако, на фоне потери рентабельности добычи на CPU, механизм не получил массового распространения.
Miners для этого механизма – CudaMiner и Yacminer.
Keccak
Этот механизм хеширования также называют SHA-3. В 2012 году он стал победителем конкурса криптографических алгоритмов и был утвержден в качестве нового федерального стандарта обработки сведений США.
Keccak применяет «механизм губки» для хеширования текста сообщения. Здесь вводная информация сначала «абсорбируется» и суммируется по узлу 2 с инвариантами состояния. Затем внутри криптографической губки происходят многосерийные перестановки и на выходе «выжимается» зашифрованный результат.
На Keccak возможно добывать Nexus, Quark, SmartCash, Maxcoin и другие монеты.
Для этой технологии подходят ccminer Alexis, Claymore miner, SGminer.
Напоследок посмотрите еще одно полезное видео от Богатейшего Ди:
Если нет желания майнить криптовалюты, купите их с помощью https://exchangesumo.com. К примеру, здесь представлены обменники, меняющие QIWI RUB на Bitcoin (BTC). Подберите выгодный курс и получите кешбэк!
Data Mining Algorithm — обзор
Вооружившись подготовленным набором данных и списком предикторов, вы готовы принять одно из самых важных решений в практике интеллектуального анализа данных: выбрать правильный алгоритм моделирования для начала. В главах 13 и 18, главе 13, главе 18 мы рассмотрим случай, когда группы алгоритмов, работающие в ансамблях, могут создавать более точные прогнозы, чем один алгоритм в одиночку. Но пока вы должны выбрать алгоритм для начала. В этой главе будут представлены основные алгоритмы, используемые при интеллектуальном анализе данных, и они помогут вам выбрать подходящий для начала.
Перед описанием отдельных алгоритмов, которые вы можете использовать в большинстве пакетов интеллектуального анализа данных, мы представим два полуавтоматических подхода к выполнению всех необходимых операций от доступа к данным до получения результатов модели. Первый пример покажет, как STATISTICA Data Miner Recipe Interface объединяет все основные этапы проекта интеллектуального анализа данных в простой в использовании интерфейс. Второй пример — KXEN (механизм извлечения знаний). Оба инструмента выбирают алгоритмы моделирования, позволяют ввести несколько настроек (выбор по умолчанию очень хорошо работает в обоих инструментах) и автоматически генерируют результаты модели.Использование любого из этих инструментов может быть лучшим способом для начинающих майнеров данных построить свою первую модель.
STATISTICA Data Miner Recipe (DMRecipe)
После создания своей первой модели вы можете почувствовать новое чувство расширения возможностей. Приятно видеть в ваших данных закономерности, которых вы раньше не видели! Процесс может включать в себя всего несколько щелчков мышью и настолько прост, что вы даже можете написать эти несколько шагов на листе бумаги, оставить его на столе вашего ассистента и попросить его провести этот анализ на следующий день, пока вы находитесь в отъезде. командировка, или встреча через город.Здесь будет кратко описан процесс DMRecipe. Подробное описание этого варианта моделирования представлено в руководстве DMRecipe.
Интерфейс DMRecipe состоит из нескольких интерактивных шагов, которые проведут вас через процесс создания очень мощных моделей при первом использовании.
- 1
Чтобы выбрать интерфейс DMRecipe на панели инструментов STATISTICA Data Miner, щелкните Data Mining, а затем Data Miner Recipe.
- 2
Выберите «Новый» на экране рецепта.
- 3
Нажмите «Открыть / подключить файл данных», чтобы выбрать набор входных данных.
- 4
При необходимости нажмите «Применить преобразования данных».
- 5
Нажмите «Выбрать переменные», чтобы выбрать исходные входные переменные.
- 6
Щелкните значок треугольника, направленного вниз (▾) (в правом верхнем углу экрана), чтобы запустить рецепт.
Когда обучение модели будет завершено, появится экран результатов, показанный на рисунке 7.1 будет отображаться.
Рисунок 7.1. Экран результатов DMRecipe показывает, что модель Boosted Trees имеет наименьшую ошибку прогноза.
Интерфейс DMRecipe предоставляет почти автоматический метод построения моделей интеллектуального анализа данных. Экран результатов (рис. 7.1) предоставляет несколько отчетов (например, графики подъема), чтобы помочь разработчику моделей оценить предсказательную силу моделей. Результаты, показанные на рисунке 7.1, показывают, что алгоритм Boosted Trees имел самый низкий уровень ошибок (Примечание: точность = 100 — коэффициент ошибок).Интерфейс DMRecipe по умолчанию выбирает несколько алгоритмов моделирования (C&RT, Boosted Trees, Neural Network). Как видно из результатов на этом рисунке, у Boosted Trees был самый низкий уровень ошибок среди обученных алгоритмов с уровнем точности 98%. Поскольку у Boosted Trees была самая высокая степень точности, она была выбрана в качестве модели, которая будет использоваться для развертывания для оценки будущих наборов данных.
Вы можете обнаружить, что некоторые наборы данных не обеспечивают приемлемой точности прогнозов ни для одной модели.В этих случаях могут быть созданы гибридные модели, обычно называемые консенсусными моделями. Этот тип модели будет обсуждаться позже, в основном в главе 13, и будет использоваться в некоторых учебных пособиях.
STATISTICA Data Miner Recipe (DMRecipe) — это полуавтоматический метод построения относительно сложных аналитических моделей для классификации (с категориальными целевыми переменными) или численного прогнозирования (с непрерывными целевыми переменными). Интерфейс DMRecipe обеспечивает пошаговый подход к подготовке данных, выбору переменных и уменьшению размерности, в результате чего модели обучаются с использованием различных алгоритмов.
Подготовка данных . Первым важным действием в процессе интеллектуального анализа данных является подготовка набора данных для моделирования. Общие операции очистки и преобразования данных могут быть выполнены для предоставления данных в формате, подходящем для алгоритмов моделирования. Кроме того, вы можете создать «слепую выборку» для дальнейшего использования в моделях проверки.
Анализ данных . После того, как набор данных будет должным образом подготовлен, вы можете провести описательный статистический анализ переменных.Вы можете оценить каждую переменную на основе среднего значения, стандартного отклонения, асимметрии, эксцесса и наблюдаемого максимума и минимума.
Резервирование данных . Некоторые переменные могут нести информацию, очень похожую на информацию о других переменных, что делает их избыточными. Инструмент DMRecipe позволяет измерить эту избыточность для непрерывных переменных. Вы должны позволить DMRecipe исключить все, кроме одной, из группы избыточных переменных. Результирующий набор переменных создаст гораздо лучшую модель.
Уменьшение размерности .Помимо устранения избыточных переменных, вы можете еще больше уменьшить количество переменных (размерность), исключив переменные, сильно коррелированные с целевой переменной. Эта операция уменьшит мультиколлинеарность набора данных и увеличит вероятность создания оптимальной модели. Прочтите главу 4, чтобы узнать больше о проблеме мультиколлинеарности.
Модельное здание . На этом этапе несколько моделей обучаются автоматически. Доступно большое количество графических дисплеев, которые помогут вам оценить результаты каждой модели.
Развертывание модели . После создания моделей интеллектуального анализа данных вы можете использовать свои модели для оценки новых наборов данных. Хорошая модель будет работать с приемлемой точностью на данных, которые не использовались для обучения.
KXEN
Аналогичная серия шагов выполняется в полуавтоматическом интерфейсе Помощника моделирования KXEN для обработки всех шагов простой операции интеллектуального анализа данных от выбора модели до результатов модели.
- 1
На вводном экране можно выбрать одну из нескольких операций интеллектуального анализа данных:
- a
Классификация или регрессия (численное прогнозирование)
- b
Кластеризация
- c
Анализ временных рядов
- d
Исследование данных
- e
Обработка данных
- 2
На втором экране предлагается ввести файл входных данных.
- 3
Третий экран позволяет просмотреть набор данных или продолжить анализ данных.
- 4
Четвертый экран предоставляет отчет метаданных для каждой переменной.
- 5
Пятый экран предоставляет возможность выбора переменных. В KXEN экран выбора переменных предлагает вам список переменных, чтобы исключить , а не включить . Поначалу нелогичный ответ вызывает недоумение, но он имеет смысл, если рассматривать его в контексте сильных сторон KXEN.Этот инструмент может принимать переменные, которые являются избыточными или коллинеарными, и автоматически анализирует их и исключает неподходящие переменные из дальнейшего анализа. Исключение переменных выполняется для того, чтобы вы не отправляли в механизм моделирования совершенно несоответствующие переменные (например, имена клиентов, коды последовательной нумерации и т. Д.).
- 6
На последнем экране представлен отчет о результатах модели (рис. 7.2).
Рисунок 7.2. Экран результатов KXEN.
В KXEN доступен ряд отчетов по моделям, аналогичных тем, которые содержатся в инструменте DMRecipe (например, в инструменте DMRecipe).ж., карты лифтов и матрицы совпадений).
Как и DMRecipe, KXEN многое делает за кулисами. Одной из самых мощных из этих скрытых функций является работа Consistent Coder. Эта функция автоматически выполняет большую часть подготовки данных, например, биннинг и перекодирование. Кроме того, KXEN автоматически выводит ряд новых переменных в виде комбинаций и преобразований существующих переменных. Это автоматическое уменьшение ненужной размерности и добавление потенциально полезной размерности (новые функции) может создавать очень мощные модели без значительной опасности мультиколлинеарности.
KXEN очень эффективен для моделирования задач, в которых необходимо разработать множество (даже тысячи) моделей, например, в областях розничной торговли. Там должны быть созданы отдельные модели прогнозирования продаж для каждой категории продаваемых товаров в крупных розничных операциях (например, в розничных супермаркетах). KXEN может очень быстро создавать огромное количество моделей.
(Почти) автоматизированные функции DMRecipe и KXEN Modeling Assistant дают представление об одном направлении, в котором развивается интеллектуальный анализ данных.Эти инструменты обеспечивают близкую аналогию с идеалом, описанным в предисловии к этой книге, в котором интеллектуальный анализ данных так же прост в использовании, как автомобильный интерфейс.
Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
- 7 минут на чтение
В этой статье
Применимо к:
Службы аналитики SQL Server
Службы аналитики Azure
Power BI Premium
Алгоритм в интеллектуальном анализе данных (или машинном обучении) — это набор эвристик и вычислений, который создает модель из данных.Чтобы создать модель, алгоритм сначала анализирует предоставленные вами данные в поисках определенных типов закономерностей или тенденций. Алгоритм использует результаты этого анализа на многих итерациях, чтобы найти оптимальные параметры для создания модели интеллектуального анализа данных. Затем эти параметры применяются ко всему набору данных для извлечения действенных шаблонов и подробной статистики.
Модель интеллектуального анализа данных, создаваемая алгоритмом на основе ваших данных, может принимать различные формы, в том числе:
Набор кластеров, описывающих, как связаны наблюдения в наборе данных.
Дерево решений, которое предсказывает результат и описывает, как различные критерии влияют на этот результат.
Математическая модель для прогнозирования продаж.
Набор правил, описывающих, как продукты группируются вместе в транзакции, и вероятности того, что продукты будут куплены вместе.
Алгоритмы, представленные в SQL Server Data Mining, являются наиболее популярными и хорошо изученными методами получения шаблонов из данных.Возьмем один пример. Кластеризация K-средних является одним из старейших алгоритмов кластеризации, который широко доступен во многих различных инструментах и с множеством различных реализаций и опций. Однако конкретная реализация кластеризации K-средних, используемая в интеллектуальном анализе данных SQL Server, была разработана Microsoft Research и затем оптимизирована для повышения производительности с помощью служб Analysis Services. Все алгоритмы интеллектуального анализа данных Microsoft могут быть полностью настроены и полностью программируются с использованием предоставленных API. Вы также можете автоматизировать создание, обучение и повторное обучение моделей с помощью компонентов интеллектуального анализа данных в службах Integration Services.
Вы также можете использовать сторонние алгоритмы, соответствующие спецификации OLE DB для интеллектуального анализа данных, или разработать собственные алгоритмы, которые можно зарегистрировать как службы, а затем использовать в среде интеллектуального анализа данных SQL Server.
Выбор правильного алгоритма
Выбор лучшего алгоритма для решения конкретной аналитической задачи может оказаться сложной задачей. Хотя вы можете использовать разные алгоритмы для выполнения одной и той же бизнес-задачи, каждый алгоритм дает разный результат, а некоторые алгоритмы могут давать более одного типа результатов.Например, вы можете использовать алгоритм Microsoft Decision Trees не только для прогнозирования, но и как способ уменьшить количество столбцов в наборе данных, поскольку дерево решений может идентифицировать столбцы, которые не влияют на окончательную модель интеллектуального анализа данных.
Выбор алгоритма по типу
SQL Server Data Mining включает следующие типы алгоритмов:
Алгоритмы классификации предсказывают одну или несколько дискретных переменных на основе других атрибутов в наборе данных.
Алгоритмы регрессии предсказывают одну или несколько непрерывных числовых переменных, таких как прибыль или убыток, на основе других атрибутов в наборе данных.
Алгоритмы сегментации разделяют данные на группы или кластеры элементов со схожими свойствами.
Алгоритмы ассоциации находят корреляции между различными атрибутами в наборе данных. Чаще всего такой алгоритм применяется для создания ассоциативных правил, которые можно использовать при анализе корзины.
Алгоритмы анализа последовательностей суммируют частые последовательности или эпизоды в данных, например, серию кликов на веб-сайте или серию событий журнала, предшествующих техническому обслуживанию машины.
Однако нет причин, по которым вы должны ограничиваться одним алгоритмом в своих решениях. Опытные аналитики иногда используют один алгоритм для определения наиболее эффективных входных данных (то есть переменных), а затем применяют другой алгоритм для прогнозирования конкретного результата на основе этих данных.SQL Server Data Mining позволяет создавать несколько моделей на основе одной структуры интеллектуального анализа данных, поэтому в рамках одного решения интеллектуального анализа данных вы можете использовать алгоритм кластеризации, модель деревьев решений и наивную байесовскую модель для получения различных представлений о ваших данных. Вы также можете использовать несколько алгоритмов в одном решении для выполнения отдельных задач: например, вы можете использовать регрессию для получения финансовых прогнозов и использовать алгоритм нейронной сети для выполнения анализа факторов, влияющих на прогнозы.
Выбор алгоритма по задаче
Чтобы помочь вам выбрать алгоритм для использования с конкретной задачей, в следующей таблице представлены предложения по типам задач, для которых каждый алгоритм обычно используется.
Связанное содержимое
В следующем разделе приведены ссылки на учебные ресурсы для каждого из алгоритмов интеллектуального анализа данных, которые предоставляются в интеллектуальном анализе данных SQL Server:
Описание базового алгоритма : Объясняет, что делает алгоритм и как он работает, а также описывает возможные бизнес-сценарии, в которых алгоритм может быть полезен.
Техническая ссылка : Содержит технические подробности о реализации алгоритма с академическими ссылками, если это необходимо. Перечисляет параметры, которые можно установить для управления поведением алгоритма и настройки результатов в модели. Описывает требования к данным и, если возможно, дает советы по производительности.
Содержимое модели : объясняет, как информация структурирована в рамках каждого типа модели интеллектуального анализа данных, и объясняет, как интерпретировать информацию, хранящуюся в каждом из узлов.
Запросы интеллектуального анализа данных : Предоставляет несколько запросов, которые можно использовать с каждым типом модели. Примеры включают запросы контента, которые позволяют узнать больше о шаблонах в модели, и запросы прогнозов, которые помогут вам строить прогнозы на основе этих шаблонов.
См. Также
Инструменты интеллектуального анализа данных
10 самых распространенных алгоритмов интеллектуального анализа данных, которые вы должны знать
Главная> Наука о данных> 10 самых распространенных алгоритмов интеллектуального анализа данных, которые вам следует знать
Интеллектуальный анализ данных — это процесс поиска закономерностей и повторов в больших наборах данных и область информатики.Методы и алгоритмы интеллектуального анализа данных широко используются в искусственном интеллекте и машинном обучении. Существует много алгоритмов, но давайте обсудим 10 лучших в списке алгоритмов интеллектуального анализа данных.
10 лучших алгоритмов интеллектуального анализа данных
1. Алгоритм C4.5
C4.5 — один из лучших алгоритмов интеллектуального анализа данных, разработанный Россом Куинланом. C4.5 используется для создания классификатора в форме дерева решений из набора данных, которые уже были классифицированы.Под классификатором здесь понимается инструмент интеллектуального анализа данных, который берет данные, которые нам нужны для классификации, и пытается предсказать класс новых данных.
Каждая точка данных будет иметь свои собственные атрибуты. Дерево решений, созданное C4.5, ставит вопрос о значении атрибута, и в зависимости от этих значений новые данные классифицируются. Набор обучающих данных помечен классами, что делает C4.5 алгоритмом обучения с учителем. Деревья решений всегда легко интерпретировать и объяснять, что делает C4.5 быстрым и популярным по сравнению с другими алгоритмами интеллектуального анализа данных.
Опыт программирования не требуется. 360 ° Карьерная поддержка. Диплом PG в области машинного обучения и искусственного интеллекта от IIIT-B и выше
2. Алгоритм K-среднего
Один из наиболее распространенных алгоритмов кластеризации, k-means работает путем создания k групп из набора объектов на основе сходства между объектами. Не может быть гарантировано, что члены группы будут в точности похожи, но члены группы будут более похожими по сравнению с членами группы, не входящими в группу. В соответствии со стандартными реализациями k-means — это алгоритм обучения без учителя, поскольку он изучает кластер самостоятельно, без какой-либо внешней информации.
3. Машины опорных векторов
С точки зрения задач, машина опорных векторов (SVM) работает аналогично алгоритму C4.5, за исключением того, что SVM вообще не использует никаких деревьев решений. SVM изучает наборы данных и определяет гиперплоскость для классификации данных на два класса. Гиперплоскость — это уравнение для линии, которая выглядит примерно так: « y = mx + b». SVM преувеличивает, чтобы проецировать ваши данные в более высокие измерения. После проектирования SVM определила лучшую гиперплоскость для разделения данных на два класса.
4. Априорный алгоритм
Алгоритм априори работает путем изучения ассоциативных правил. Правила ассоциации — это метод интеллектуального анализа данных, который используется для изучения корреляций между переменными в базе данных. Как только правила ассоциации изучены, они применяются к базе данных, содержащей большое количество транзакций. Алгоритм априори используется для обнаружения интересных закономерностей и взаимоотношений и, следовательно, рассматривается как подход к обучению без учителя. Хотя алгоритм очень эффективен, он потребляет много памяти, занимает много места на диске и занимает много времени.
5. Алгоритм максимизации ожидания
Максимальное ожидание (EM) используется в качестве алгоритма кластеризации, как и алгоритм k-средних для обнаружения знаний. Алгоритм EM работает в итерациях, чтобы оптимизировать шансы увидеть наблюдаемые данные. Затем он оценивает параметры статистической модели с ненаблюдаемыми переменными, тем самым генерируя некоторые наблюдаемые данные. Алгоритм ожидания-максимизации (EM) снова является неконтролируемым обучением, поскольку мы используем его без предоставления какой-либо помеченной информации о классе
6.Алгоритм PageRank
PageRank обычно используется поисковыми системами, такими как Google. Это алгоритм анализа ссылок, который определяет относительную важность объекта, связанного в сети объектов. Анализ ссылок — это тип сетевого анализа, который исследует ассоциации между объектами. Поиск Google использует этот алгоритм, понимая обратные ссылки между веб-страницами.
Это один из методов, который Google использует для определения относительной важности веб-страницы и повышения ее рейтинга в поисковой системе Google.Торговая марка PageRank является собственностью Google, а алгоритм PageRank запатентован Стэнфордским университетом. PageRank рассматривается как подход к обучению без учителя, поскольку он определяет относительную важность, просто рассматривая ссылки, и не требует каких-либо дополнительных данных.
7. Алгоритм Adaboost
AdaBoost — это алгоритм повышения, используемый для построения классификатора. Классификатор — это инструмент интеллектуального анализа данных, который принимает данные и предсказывает класс данных на основе входных данных.Алгоритм повышения — это алгоритм обучения ансамбля, который запускает несколько алгоритмов обучения и объединяет их.
Алгоритмы
Boosting берут группу слабых учеников и объединяют их в одного сильного ученика. Слабый ученик классифицирует данные с меньшей точностью. Лучшим примером слабого алгоритма является алгоритм принятия решения, который в основном представляет собой одношаговое дерево решений. Adaboost — это идеальное контролируемое обучение, поскольку он работает в итерациях, и на каждой итерации он обучает более слабых учеников с помощью помеченного набора данных.Adaboost — это простой и довольно простой в реализации алгоритм.
После того, как пользователь указывает количество раундов, каждая последующая итерация AdaBoost переопределяет веса для каждого из лучших учеников. Это делает Adaboost очень элегантным способом автоматической настройки классификатора. Adaboost является гибким, универсальным и элегантным, поскольку он может включать в себя большинство алгоритмов обучения и может обрабатывать большое количество разнообразных данных.
Чтение: наиболее распространенные примеры интеллектуального анализа данных
8.kNN Алгоритм
кНН — это алгоритм ленивого обучения, используемый в качестве алгоритма классификации. Ленивый ученик не будет делать ничего особенного в процессе обучения, кроме сохранения данных обучения. Ленивые ученики начинают классификацию только тогда, когда на вход вводятся новые немаркированные данные. С другой стороны, C4.5, SVN и Adaboost — это активные ученики, которые начинают строить модель классификации во время самого обучения. Поскольку kNN предоставляется помеченный обучающий набор данных, он рассматривается как контролируемый алгоритм обучения.
9. Наивный байесовский алгоритм
Наивный байесовский алгоритм — это не единичный алгоритм, хотя можно увидеть, что он эффективно работает как единый алгоритм. Наивный Байес — это совокупность алгоритмов классификации, собранных вместе. Предположение, используемое семейством алгоритмов, состоит в том, что каждая характеристика классифицируемых данных не зависит от всех других характеристик, которые даны в классе. Наивный байесовский метод снабжен помеченным обучающим набором данных для построения таблиц. Таким образом, он рассматривается как алгоритм обучения с учителем.
Продвинутая сертификация Data Science, 250+ партнеров по найму, 300+ часов обучения, 0% EMI
10. Алгоритм КОРЗИНЫ
CART — это деревья классификации и регрессии. Это алгоритм обучения дерева решений, который дает на выходе деревья регрессии или классификации. В CART узлы дерева решений будут иметь ровно 2 ветви. Как и C4.5, CART также является классификатором. Модель дерева регрессии или классификации строится с использованием помеченного набора обучающих данных, предоставленного пользователем.Следовательно, это рассматривается как метод обучения с учителем
Заключение
Итак, вот 10 лучших данных из списка алгоритмов интеллектуального анализа данных. Мы надеемся, что эта статья пролила свет на эти алгоритмы.
Если вам интересно узнать больше о Data Science, ознакомьтесь с дипломом PG Diploma in Data Science IIIT-B и выше, который разработан для работающих профессионалов, чтобы повысить свою квалификацию, не покидая своей работы. Курс предлагает индивидуальные занятия с отраслевыми наставниками, вариант Easy EMI, статус выпускников IIIT-B и многое другое.Проверьте, чтобы узнать больше.
Диплом PG от IIIT Бангалор
БУДЬТЕ ДАННЫМ В IIIT BANGALORE И ОБНОВЛЕНИЕ ЗА 11 МЕСЯЦЕВ. ДОСТУПНЫ ОПЦИИ EMI.
Зарегистрируйтесь сейчас @ upGrad
Добыча
биткойнов становится сложнее, поскольку алгоритм корректирует
Добывать биткойны стало сложнее и менее прибыльно.
Каждые 2016 блоков или примерно каждые две недели биткойн сбрасывает, насколько сложно майнерам майнить.Рано утром в пятницу, как и ожидалось, биткойн-код автоматически усложнил решение блока примерно на 7,3%.
С исторической точки зрения, этот скачок сложности намного больше, но это не удивительно и не тревожно. Но это первый значительный рост с тех пор, как вступил в силу запрет на добычу полезных ископаемых в Китае, и служит подтверждением тенденции, о которой мы уже знали: некоторые из шахтеров, которые раньше были в Китае, находят новые дома в других местах.
И хотя чеканить биткойны может быть не так прибыльно, как это было до того, как алгоритм самокорректировался, майнеры продолжают зарабатывать гораздо больше денег, чем они были до подавления криптовалют в Китае в мае.
«Уровни хешрейта по-прежнему на 42,1% ниже пикового значения в мае 2021 года, когда произошел исход из Китая», — сказал Джейсон Дин, аналитик консалтинговой компании Quantum Economics. Этот дефицит хешрейта означает, что те, кто прямо сейчас подключены к сети биткойнов, зарабатывают деньги.
Возвращение в онлайн
Когда этой весной Китай выгнал всех своих майнеров, более половины вычислительных мощностей в сети биткойнов отключились. Горняки во всем мире должны были восполнить пробел.Меньшее количество людей и меньшая вычислительная мощность означали, что на проверку транзакций и чеканку новых биткойнов уходило больше времени.
Итак, как по маслу, алгоритм биткойна самокорректировался для этого отклонения от нормы, и в июле в сети произошло беспрецедентное снижение уровня сложности на 28%. Внезапно стало легче создавать новый биткойн, и мировой майнинг-коллектив вернулся к решению блоков транзакций в среднем за десять минут.
Подробнее о криптовалютах читайте в CNBC Pro
Эта функция кода биткойна является важной частью его сетевой архитектуры.
Этой весной вся страна, на долю которой приходилось 54% от общего хешрейта биткойна, отключилась от сети, и биткойн не пропустил ни секунды.
«В сети биткойнов не было никакого простоя. На самом деле это самая умная часть программного обеспечения биткойнов: регулировка сложности», — сказал инженер по добыче биткойнов Брэндон Арванаги.
Весь эпизод считался событием «черного лебедя» для индустрии, и, по словам крипто-майнера Алехандро де ла Торре, он также сделал многих людей намного богаче.
Теперь, с новой корректировкой, Дин сообщает CNBC, что добыча биткойнов после обновления существенно на 7,3% дешевле.
«Если предположить, что стоимость энергии и хешрейт останутся неизменными, расчет действительно так же прост, как кажется на первый взгляд», — сказал Дин.
Регулировка сложности также отражает тот факт, что мир майнинга уже достиг дна с точки зрения глобального хешрейта. С конца июня майнеры быстро возвращаются в онлайн.
Увеличить значок Стрелки, указывающие наружу
«Мы увидели дно падения хешрейта, и это не что иное, как отсюда», — сказал Майк Колайер, генеральный директор компании Foundry, занимающейся цифровой валютой, которая помогла доставить на Север майнинговое оборудование на сумму более 300 миллионов долларов. Америка.
«Эта следующая корректировка отражает тот факт, что горняки наращивают мощности и подключают новые машины. Из Китая поступает огромное количество машин, которым необходимо найти новые дома», — продолжил Колайер.
Восстановление сети биткойнов
Некоторые из машин, возвращающихся в сеть, совпадают с теми, которые были подключены по всему Китаю.
«Большинство этих парней не могут переехать в США из-за ограничений, связанных с капиталом, потому что они не говорят по-английски и никогда за всю свою жизнь не покидали регион Сычуань.Вместо этого они продали все свои машины «, — пояснил Де Ла Торре, вице-президент майнингового пула Poolin со штаб-квартирой в Сингапуре.
. .
Но многие из ASIC, поступающих в сеть, прямо с производственных линий крупнейших производителей на планете, таких как Bitmain и Whatsminer. Эти новые установки более эффективны, и Колайер говорит, что они получают примерно вдвое большую хэш-мощность за такое же количество электричество.
Фактически, многие инсайдеры в сфере майнинга предсказывают, что большая часть оборудования старого поколения никогда не вернется в рабочий режим, а это означает, что вся сеть станет более эффективной и вызовет усиление конкуренции среди майнеров.
«Новые машины имеют значительно более высокий хешрейт, чем их предшественники, поэтому мы, вероятно, увидим, что хешрейт продолжит возвращаться к новому рекордному уровню где-то в следующие 12 месяцев», — сказал Уит Гиббс, генеральный директор и основатель поставщика услуг по добыче биткойнов Compass. .
По словам Дина, некоторые из этих новых машин в настоящее время находятся в пути к покупателям.У некоторых крупных игроков есть заказ на десятки тысяч новых ASIC, которые должны появиться в сети в течение следующих 12 месяцев.
«Это означает, что сложность будет продолжать неуклонно расти, и, вероятно, довольно значительно, за тот же период», — сказал Дин.
Между тем, Колайер говорит, что с этого момента следует ожидать корректировки сложности более чем на 10% каждый месяц. Он думает, что потребуется еще девять-двенадцать месяцев, чтобы сложность удвоилась.
Алгоритмы, методы и лучшие инструменты интеллектуального анализа данных
В этом подробном руководстве по методам интеллектуального анализа данных объясняются алгоритмы, инструменты интеллектуального анализа данных и методы извлечения полезных данных:
В этом учебном пособии по углубленному интеллектуальному анализу данных для всех мы изучили все, что касается интеллектуального анализа данных, в нашем предыдущем руководстве.
В этом руководстве мы узнаем о различных методах, используемых для извлечения данных. Поскольку мы знаем, что интеллектуальный анализ данных — это концепция извлечения полезной информации из огромного количества данных, некоторые методы и методы применяются к большим наборам данных для извлечения полезной информации.
Эти методы в основном представляют собой методы и алгоритмы, применяемые к наборам данных. Некоторые из методов интеллектуального анализа данных включают Частые шаблоны интеллектуального анализа данных, ассоциации и корреляции, классификации, кластеризацию, обнаружение выбросов, а также некоторые передовые методы, такие как статистический, визуальный и звуковой анализ данных.
Как правило, для методов интеллектуального анализа данных используются реляционные базы данных, транзакционные базы данных и хранилища данных. Однако существуют также некоторые передовые методы интеллектуального анализа сложных данных, таких как временные ряды, символьные последовательности и последовательные биологические данные.
Назначение методов интеллектуального анализа данных
Поскольку каждый день хранится огромное количество данных, компании теперь заинтересованы в том, чтобы узнать их тенденции. Методы извлечения данных помогают преобразовать необработанные данные в полезные знания.Для добычи огромных объемов данных требуется программное обеспечение, поскольку человек не может вручную просмотреть большой объем данных.
Программа интеллектуального анализа данных анализирует взаимосвязь между различными элементами в больших базах данных, что может помочь в процессе принятия решений, узнать больше о клиентах, разработать маркетинговые стратегии, увеличить продажи и снизить затраты.
Метод интеллектуального анализа данных, который будет применяться, зависит от перспективы нашего анализа данных.
Итак, давайте обсудим различные методы того, как извлечение данных может выполняться разными способами:
# 1) Частое обнаружение паттернов / анализ ассоциаций
Этот тип техники интеллектуального анализа данных ищет повторяющиеся связи в заданном наборе данных. Он будет искать интересные ассоциации и корреляции между различными элементами в базе данных и определять закономерность.
Примером такого рода может быть «Анализ корзины покупок»: выяснение, «какие продукты покупатели, вероятно, купят вместе в магазине?» например, хлеб с маслом.
Заявка: Проектирование размещения товаров на полках магазинов, маркетинг, кросс-продажи товаров.
Шаблоны могут быть представлены в виде ассоциативных правил. Правило ассоциации гласит, что поддержка и уверенность — это параметры, позволяющие определить полезность связанных элементов. Транзакции, в которых оба предмета были куплены вместе за один раз, известны как поддержка.
Сделки, в которых покупатели купили оба товара, но один за другим, являются доверительными.Добытый шаблон будет считаться интересным, если он имеет значение минимального порога поддержки и минимального порога достоверности . Пороговые значения устанавливаются экспертами в предметной области.
Хлеб => масло [поддержка = 2%, уверенность-60%]
Приведенный выше оператор является примером правила ассоциации. Это означает, что существует 2% -ная транзакция, при которой вместе покупается хлеб с маслом, а 60% клиентов покупают хлеб и масло.
Шаги по внедрению анализа ассоциации:
- Поиск частых наборов товаров. Набор предметов — это набор предметов. Набор элементов, содержащий k элементов, является набором k элементов. Частота набора элементов — это количество транзакций, содержащих набор элементов.
- Создание строгих ассоциативных правил из часто встречающихся наборов элементов. Под строгими правилами ассоциации мы подразумеваем достижение минимального порогового уровня поддержки и уверенности.
Существуют различные часто используемые методы интеллектуального анализа наборов элементов, такие как априорный алгоритм, метод роста по шаблону и интеллектуальный анализ с использованием вертикального формата данных.Этот метод широко известен как анализ рыночной корзины.
# 2) Корреляционный анализ
Корреляционный анализ — это просто расширение правил ассоциации. Иногда параметры поддержки и уверенности могут по-прежнему давать пользователям неинтересные модели.
Примером, подтверждающим вышеприведенное утверждение, может быть следующее: из 1000 проанализированных транзакций 600 содержали только хлеб, в то время как 750 содержали масло, а 400 содержали и хлеб, и масло. Предположим, что минимальная поддержка выполнения правила ассоциации составляет 30%, а минимальная достоверность — 60%.
Значение поддержки 400/1000 = 40% и значение достоверности = 400/600 = 66% соответствует пороговому значению. Однако мы видим, что вероятность покупки сливочного масла составляет 75%, что больше 66%. Это означает, что между хлебом и маслом существует отрицательная корреляция, поскольку покупка одного приведет к уменьшению покупки другого. Результаты обманчивы.
Из приведенного выше примера поддержка и уверенность дополняются другой мерой интереса, то есть корреляционным анализом, который поможет в поиске интересных паттернов.
A => B [поддержка, уверенность, корреляция].
Правило корреляции измеряется поддержкой, достоверностью и корреляцией между наборами элементов A и B. Корреляция измеряется с помощью подъема и хи-квадрат.
(i) Подъем: Как сказано в самом слове, Подъем представляет собой степень, в которой наличие одного набора элементов увеличивает вхождение других наборов элементов.
Подъемную силу между точками A и B можно измерить по:
Лифт (A, B) = P (A U B) / P (A).П (В).
Если он <1, то A и B имеют отрицательную корреляцию.
Если это> 1. Тогда A и B положительно коррелируют, что означает, что появление одного подразумевает появление другого.
Если он = 1, то корреляции между ними нет.
(ii) Хи-квадрат: Это еще одна мера корреляции. Он измеряет квадрат разницы между наблюдаемым и ожидаемым значением для слота (пара A и B), деленный на ожидаемое значение.
Если он> 1, значит, он отрицательно коррелирован.
№ 3) Классификация
Classification помогает в построении моделей важных классов данных. Модель или классификатор создаются для прогнозирования меток классов. Ярлыки — это определенные классы с дискретными значениями, такими как «да» или «нет», «безопасно» или «рискованно». Это тип обучения с учителем, поскольку класс меток уже известен.
Классификация данных — двухэтапный процесс:
- Шаг обучения: Модель построена здесь. Предварительно определенный алгоритм применяется к данным для анализа с предоставленной меткой класса, и создаются правила классификации.
- Шаг классификации: Модель используется для прогнозирования меток классов для заданных данных. Точность правил классификации оценивается по тестовым данным, которые, если они оказываются точными, используются для классификации новых кортежей данных.
Элементы в наборе элементов будут назначены целевым категориям для прогнозирования функций на уровне метки класса.
Заявка: Банки для определения соискателей ссуды как компаний с низким, средним или высоким уровнем риска, разрабатывающие маркетинговые кампании на основе классификации по возрастным группам.`
# 4) Индукция дерева принятия решений
Метод индукции
деревьев решений относится к классификационному анализу. Дерево решений — это древовидная структура, которую легко понять, просто и быстро. В этом случае каждый нелистовой узел представляет тест для атрибута, и каждая ветвь представляет результат теста, а листовой узел представляет метку класса.
Значения атрибутов в кортеже проверяются по дереву решений от корня до конечного узла. Деревья решений популярны, поскольку не требуют знания предметной области.Они могут представлять многомерные данные. Деревья решений можно легко преобразовать в правила классификации.
Приложение: Деревья решений построены в медицине, производстве, производстве, астрономии и т. Д. Пример можно увидеть ниже:
# 5) Байесовская классификация
Байесовская классификация — это еще один метод классификационного анализа. Классификаторы Байеса предсказывают вероятность того, что данный кортеж принадлежит определенному классу.Он основан на теореме Байеса, которая основана на теории вероятностей и решений.
Байесовская классификация работает с апостериорной вероятностью и априорной вероятностью для процесса принятия решений. По апостериорной вероятности гипотеза делается на основе данной информации, то есть значения атрибутов известны, в то время как для априорной вероятности гипотезы даются независимо от значений атрибутов.
# 6) Кластерный анализ
Это метод разделения набора данных на кластеры или группы объектов.Кластеризация выполняется с использованием алгоритмов. Это тип обучения без учителя, поскольку информация на этикетке неизвестна. Методы кластеризации идентифицируют данные, которые похожи или отличаются друг от друга, и проводится анализ характеристик.
Кластерный анализ можно использовать в качестве предварительного шага для применения различных других алгоритмов, таких как определение характеристик, выбор подмножества атрибутов и т. Д. Кластерный анализ также можно использовать для обнаружения выбросов, таких как большие покупки в транзакциях по кредитным картам.
Приложения: Распознавание изображений, поиск в Интернете и безопасность.
# 7) Обнаружение выбросов
Процесс поиска объектов данных, которые обладают исключительным поведением по сравнению с другими объектами, называется обнаружением выбросов. Обнаружение выбросов и кластерный анализ связаны друг с другом. Методы выбросов подразделяются на статистические, основанные на близости, основанные на кластеризации и основанные на классификации.
Существуют разные типы выбросов, некоторые из них:
- Глобальный выброс: Объект данных значительно отличается от остального набора данных.
- Контекстный выброс: Это зависит от определенных факторов, таких как день, время и местоположение. Если объект данных значительно отклоняется от контекста.
- Коллективный выброс: Когда группа объектов данных ведет себя иначе, чем весь набор данных.
Приложение: Обнаружение рисков мошенничества с кредитными картами, обнаружение новизны и т. Д.
# 8) Последовательные шаблоны
В этом типе интеллектуального анализа данных распознается тренд или некоторые непротиворечивые закономерности.Понимание покупательского поведения покупателей и последовательных закономерностей используется магазинами для размещения своих товаров на полках.
Приложение: Пример электронной торговли, где при покупке товара A будет показано, что товар B часто покупается вместе с товаром A, если посмотреть на прошлую историю покупок.
# 9) Регрессионный анализ
Этот тип анализа контролируется и определяет, какие наборы элементов среди различных отношений связаны друг с другом или не зависят друг от друга.Он может прогнозировать продажи, прибыль, температуру, прогнозировать поведение людей и т. Д. Он имеет значение набора данных, которое уже известно.
Когда вводится, алгоритм регрессии сравнивает ввод и ожидаемое значение, и вычисляется ошибка, чтобы получить точный результат.
Приложение: Сравнение усилий по маркетингу и разработке продуктов.
Лучшие алгоритмы интеллектуального анализа данных
Методы интеллектуального анализа данных применяются через лежащие в его основе алгоритмы.Эти алгоритмы работают в программном обеспечении для извлечения данных и применяются в зависимости от потребностей бизнеса.
Некоторые из алгоритмов, которые широко используются организациями для анализа наборов данных, определены ниже:
- K-means: Это популярный метод кластерного анализа, при котором группа похожих элементов группируется вместе.
- Априорный алгоритм: Это частый метод интеллектуального анализа наборов элементов, и правила ассоциации применяются к нему в транзакционных базах данных.Он обнаружит частые наборы элементов и выделит общие тенденции.
- K Ближайший сосед: Этот метод используется для классификации и регрессионного анализа. Ближайший k-сосед — это ленивое обучение, где он хранит обучающие данные, и когда приходят новые немаркированные данные, он классифицирует входные данные.
- Naves Bayes: Это группа простых алгоритмов вероятностной классификации, которые предполагают, что свойства каждого объекта данных не зависят друг от друга. Это приложение теоремы Байеса.
- AdaBoost: Это мета-алгоритм машинного обучения, который используется для повышения производительности. Adaboost чувствителен к зашумленным данным и выбросам.
Некоторые расширенные методы интеллектуального анализа данных для обработки сложных типов данных описаны ниже.
В современном мире данные бывают разных типов, от простых до сложных. Для добычи сложных типов данных, таких как временные ряды, многомерные, пространственные и мультимедийные данные, необходимы передовые алгоритмы и методы.
Некоторые из них описаны ниже:
- CLIQUE: Это был первый метод кластеризации для поиска кластеров в многомерном подпространстве.
- P3C: Это хорошо известный метод кластеризации многомерных данных от среднего до высокого.
- LAC: Это метод на основе k-средних, предназначенный для кластеризации данных с умеренной и высокой размерностью. Алгоритм разбивает данные на k непересекающихся элементов, удаляя возможные выбросы.
- CURLER: Это алгоритм корреляционной кластеризации, он выявляет как линейные, так и нелинейные корреляции.
Лучшие инструменты интеллектуального анализа данных
Data Mining Tools — это программное обеспечение, используемое для сбора данных. Инструменты запускают алгоритмы на сервере. Эти инструменты доступны на рынке в виде версий с открытым исходным кодом, бесплатного программного обеспечения и лицензионных версий.
Некоторые инструменты извлечения данных включают:
# 1) RapidMiner
RapidMiner — это программная платформа с открытым исходным кодом для аналитических групп, которая объединяет подготовку данных, машинное обучение и развертывание прогнозных моделей.Этот инструмент используется для проведения анализа интеллектуального анализа данных и создания моделей данных. Он имеет большие наборы алгоритмов классификации, кластеризации, анализа ассоциативных правил и регрессии.
# 2) Оранжевый
Это инструмент с открытым исходным кодом, содержащий пакет визуализации и анализа данных. Orange можно импортировать в любую рабочую среду Python. Он хорошо подходит для новых исследователей и небольших проектов.
№ 3) KEEL
KEEL (Извлечение знаний на основе эволюционного обучения) — это программный инструмент Java с открытым исходным кодом (GPLv3), который можно использовать для большого количества различных задач по обнаружению данных знаний.
# 4) SPSS
IBM SPSS Modeler — это программное обеспечение для интеллектуального анализа данных и текстовой аналитики от IBM. Он используется для построения прогнозных моделей и выполнения других аналитических задач.
# 5) KNIME
Это бесплатный инструмент с открытым исходным кодом, содержащий пакет очистки и анализа данных, специализированные алгоритмы в области анализа настроений и анализа социальных сетей. KNIME может объединять данные из разных источников в один анализ. Имеет интерфейс для программирования на Java, Python и R.
Важный вопрос: Чем классификация отличается от прогноза?
Классификация — это группировка данных. Пример классификации — это группировка на основе возрастной группы, состояния здоровья и т. Д. В то время как при прогнозировании выводится результат с использованием классифицированных данных.
Пример прогнозного анализа — это прогнозирование интересов на основе возрастной группы, лечения какого-либо заболевания. Прогнозирование также известно как оценка непрерывных значений.
Важный термин: интеллектуальный анализ данных
Predictive Data Mining предназначен для прогнозирования определенных тенденций данных с использованием бизнес-аналитики и других данных. Это помогает компаниям лучше анализировать и принимать более обоснованные решения. Прогнозная аналитика часто сочетается с прогнозным интеллектуальным анализом данных.
Predictive Data Mining находит релевантные данные для анализа. Предиктивная аналитика использует данные для прогнозирования результата.
Заключение
В этом руководстве мы обсудили различные методы интеллектуального анализа данных, которые могут помочь организациям и предприятиям найти наиболее полезную и актуальную информацию.Эта информация используется для создания моделей, которые будут прогнозировать поведение клиентов, чтобы предприятия могли действовать в соответствии с этим.
Прочитав всю вышеупомянутую информацию о методах интеллектуального анализа данных, можно еще лучше определить ее надежность и осуществимость. Методы извлечения данных включают работу с данными, переформатирование данных, реструктуризацию данных. Формат необходимой информации зависит от техники и анализа, который необходимо провести.
Наконец, все методы, методы и системы интеллектуального анализа данных помогают в открытии новых творческих инноваций.
PREV Tutorial | СЛЕДУЮЩИЙ Учебник
Объяснение майнинга биткойнов — издание 2021 года
С момента своего введения в 2009 году Сатоши Накамото, биткойн взволновал инвесторов, технических специалистов и обычных людей. Вмешались даже такие знаменитости, как Майк Тайсон; бывший профессиональный боксер запустил как биткойн-банкомат, так и приложение для биткойн-кошелька. Но вам не нужно быть профессионалом, чтобы понять, как работает биткойн.
Видеоурок
Simplilearn объясняет процесс добычи биткойнов и преимущества биткойнов перед традиционными фиатными валютами.Сначала мы рассмотрим некоторые основы биткойна, а затем обсудим, как работает майнинг биткойнов.
Что такое биткойн?
Биткойн — первая децентрализованная цифровая валюта, которая позволяет осуществлять одноранговые переводы без каких-либо посредников, таких как банки, правительства, агенты или брокеры, с использованием базовой технологии блокчейна. Любой человек в сети может передавать биткойны кому-либо еще в сети независимо от географического положения; вам просто нужно просто открыть учетную запись в сети Биткойн и иметь в ней несколько биткойнов, а затем вы можете перевести эти биткойны.Как вы получаете биткойны на свой счет? Вы можете либо купить их в Интернете, либо добыть их.
Биткойн можно использовать для покупок в Интернете и в качестве инвестиционного инструмента. В основном он используется для покупки товаров и услуг.
Преимущества Биткойн
По сравнению с традиционными фиатными валютами, активы могут быть перемещены в сети биткойнов быстрее. Система также имеет более низкую комиссию за транзакции, поскольку она децентрализована, в ней нет посредников, и она криптографически безопасна — личности отправителя и получателя скрыты, и невозможно подделать или взломать транзакции.Кроме того, вся информация доступна в публичной книге, поэтому любой может просматривать транзакции.
Что такое блокчейн?
Как уже упоминалось, блокчейн является базовой технологией биткойна. Блокчейн — это общедоступный распределенный реестр, в котором транзакции записываются в хронологическом порядке. Любая запись или транзакция, добавленные в цепочку блоков, не могут быть изменены или изменены, что означает, что транзакции защищены от взлома. Блок — это наименьшая единица цепочки блоков, и это контейнер, в котором хранятся все детали транзакции.Блок имеет четыре поля или первичных атрибута:
- Предыдущий хэш: Этот атрибут хранит значение хеш-функции предыдущего блока и то, как блоки связаны друг с другом.
- Данные: Это агрегированный набор транзакций, включенных в этот блок — набор транзакций, которые были добыты, проверены и включены в блок.
- Одноразовый номер: В алгоритме консенсуса «доказательство работы», который использует биткойн, одноразовый номер — это случайное значение, используемое для изменения вывода хеш-значения.Каждый блок должен генерировать хеш-значение, а nonce — это параметр, который используется для генерации этого хеш-значения. Доказательство работы — это процесс проверки транзакции, выполняемый в блокчейне.
- Хэш: Это значение, полученное путем передачи предыдущего значения хеш-функции, данных и одноразового номера через алгоритм SHA-256; это цифровая подпись блока.
SHA-256 — это алгоритм криптографического хеширования, который создает уникальное 256-битное буквенно-цифровое хеш-значение для любого заданного ввода, и это уникальная особенность этого криптографического алгоритма: какой бы ввод вы ни давали, он всегда будет производить 256-битный хэш .
Что такое биткойн-майнинг?
Майнинг биткойнов — это процесс проверки транзакций биткойнов и их записи в общедоступную бухгалтерскую книгу цепочки блоков. В блокчейне транзакции проверяются пользователями биткойнов, поэтому в основном транзакции должны проверяться участниками сети. Те, у кого есть необходимое оборудование и вычислительная мощность, называются майнерами.
Мы поговорим о них подробнее позже, но здесь важно понять, что нет ничего лучше централизованного органа — регулирующего органа, руководящего органа, банка — для осуществления транзакций с биткойнами.Любой пользователь с оборудованием для майнинга и доступом в Интернет может стать участником и внести свой вклад в сообщество майнеров.
Процесс решается на основе сложной математической головоломки, которая называется доказательством работы. Доказательство работы необходимо для подтверждения транзакции и для получения вознаграждения майнеру. Все майнеры завершают между собой майнинг определенной транзакции; майнер, первым решивший загадку, получает награду. Майнеры — это участники сети, у которых есть необходимое оборудование и вычислительные мощности для проверки транзакций.
3 концепции блокчейна
Чтобы понять майнинг биткойнов, вы должны сначала понять три основных концепции блокчейна.
- Публичный распределенный реестр: Распределенный реестр — это запись всех транзакций, поддерживаемых в сети блокчейнов по всему миру. В сети проверка транзакций выполняется пользователями биткойнов.
- SHA-256: Цепочка блоков предотвращает несанкционированный доступ с помощью хэш-функции SHA-256 для обеспечения безопасности блоков.Они имеют цифровую подпись. Их хеш-значение, однажды сгенерированное, не может быть изменено. SHA-256 принимает входную строку любого размера и возвращает фиксированный 256-битный вывод, и это односторонняя функция — вы не можете полностью вывести обратную входную строку полностью из вывода (того, что вы сгенерировали).
- Proof of work: При майнинге блокчейнов майнеры проверяют транзакции, решая сложную математическую задачу, называемую доказательством работы. Для этого основная задача майнера — определить значение nonce, и это значение nonce является математической головоломкой, которую майнеры должны решить для генерации хэша, который меньше целевого значения, определенного сетью для конкретного блока.
Решение головоломки
В сети биткойнов, как уже упоминалось, пользователи, называемые майнерами, пытаются решить математическую задачу. Головоломка решается путем изменения одноразового номера, который дает значение хеш-функции ниже заранее определенного условия, которое называется целью. Майнер проверяет транзакцию, решая головоломку и добавляя блок в цепочку блоков, когда он подтверждается и проверяется другими пользователями. На сегодняшний день биткойн-майнеры, решившие головоломку, получают вознаграждение в размере 12.5 биткойнов.
После добавления блока в цепочку блоков биткойны, связанные с транзакциями, могут быть потрачены, и может быть осуществлен перевод с одной учетной записи на другую.
Для генерации хеш-кода биткойн-майнеры используют алгоритм хеширования SHA-256 и определяют значение хеш-функции. Если оно меньше заданного условия (цели), головоломка считается решенной. Если нет, то они продолжают изменять значение nonce и повторяют функцию хеширования SHA-256, чтобы снова сгенерировать хеш-значение, и они продолжают делать этот процесс, пока не получат хеш-значение, которое меньше целевого.
Пример: перевод 10 биткойнов
Допустим, Бейонсе хочет поделиться 10 биткойнами с Дженнифер. Что для этого нужно сделать? Во-первых, данные транзакции передаются пользователям биткойнов из пула памяти. Транзакция находится в незаминированном пуле транзакций памяти. В пуле памяти неподтвержденные транзакции ждут, пока они не будут проверены и включены в новый блок. Биткойн-майнеры соревнуются за подтверждение транзакции с помощью доказательства работы. Майнер, который решает головоломку первым, делится результатом с другими узлами.Как только блок будет проверен, будет сгенерирован одноразовый номер, затем узлы начнут предоставлять свое одобрение. Если максимальное количество узлов дает свое одобрение, блок становится действительным и добавляется в цепочку блоков. Майнер, решивший головоломку, также получит вознаграждение в размере 12,5 биткойнов, что на сегодняшний день составляет около 98000 долларов.
10 биткойнов, для которых сейчас была инициирована транзакция, будут переведены от Бейонсе к Дженнифер.
Proof of Work: внимательный взгляд
В доказательстве выполнения работы предварительно определенное условие (цель) корректируется для каждых 2016 блоков, что примерно каждые 14 дней.Среднее время майнинга блока составляет 10 минут, и, чтобы сохранить временные рамки для генерации блока в пределах 10 минут, цель постоянно корректируется.
Сложность головоломки меняется в зависимости от времени, необходимого для добычи блока. Вот как создается сложность блока: это хеш-цель первого блока, деленная на хеш-цель текущего блока. Эта сложность меняется после каждых 2016 блоков, поэтому в основном очень сложно создать доказательство работы, но майнерам очень легко проверить, как только кто-то решил головоломку.И как только большинство майнеров достигают консенсуса, блок проверяется и добавляется в цепочку блоков.
Поскольку сложность зависит от целевого хеш-кода, его значение продолжает меняться после каждых 2016 блоков, а с момента создания биткойна в 2009 году для майнинга сегодня требуется больше мощности хеширования (больше вычислительной мощности).
Предотвращение взлома
Что, если кто-то попытается взломать данные? Блокчейн, как следует из названия, представляет собой цепочку блоков — назовем блоки A, B и C.Каждый блок решил головоломку и сгенерировал собственное хеш-значение, которое является его идентификатором. Теперь предположим, что человек пытается вмешаться в блок B и изменить данные. Данные агрегируются в блоке, поэтому, если данные блока изменяются, то значение хеш-функции, являющееся цифровой подписью блока, также изменится. Следовательно, это повредит цепочку после нее — все блоки перед блоком B будут отсоединены, потому что предыдущее значение хеш-функции блока C не останется действительным.
Для того, чтобы хакер сделал всю цепочку блоков действительной для измененного блока B, он или она должны были бы изменить значение хеш-функции всех блоков перед блоком B.Это потребует огромных вычислительных мощностей и практически невозможно. С помощью этого метода блокчейн невозможно взломать и предотвратить изменение данных.
Оборудование для майнинга биткойнов
На заре биткойнов майнеры для решения математических задач использовали обычные процессоры, управляя процессорами (CPU). Раньше майнинг биткойнов и других криптовалют занимал много времени, хотя уровни сложности были проще, чем сегодня.Как упоминалось выше, уровень сложности постоянно меняется и растет, поэтому майнерам также пришлось увеличить свою вычислительную мощность.
Они обнаружили, что графические процессоры (GPU) оказались более эффективными, чем обычные процессоры, но это также имело недостаток в том, что они потребляли больше электроэнергии. Майнер должен рассчитать окупаемость инвестиций на основе оборудования, а также стоимости электроэнергии и других ресурсов, необходимых для майнинга.
Сегодня майнеры используют оборудование, называемое ASIC (специализированная интегральная схема), которое было специально введено для майнинга биткойнов и других криптовалют.Он потребляет меньше энергии и имеет большую вычислительную мощность. Майнеры получают прибыль, когда их стоимость ресурсов для добычи одного блока меньше, чем цена вознаграждения.
Итак, биткойн-майнеры используют свои ресурсы (оборудование и электричество) для проверки транзакции, и каждый раз, когда добывается блок, в сети создаются новые биткойны. Общее количество ограничено 21 миллионом биткойнов; Уже добыто от 17 до 18 миллионов биткойнов, поэтому осталось только 3-4 миллиона. На сегодня награда 12.5 биткойнов выдается майнеру, который выполняет проверку транзакции, но вознаграждение за майнинг биткойнов идет по принципу деления вдвое: оно уменьшается вдвое каждые 210000 блоков или примерно каждые четыре года, поэтому, когда этот следующий порог будет достигнут, вознаграждение в биткойнах будет до 6,25 биткойнов.
Найдите наши курсы по блокчейну в лучших городах |
Объединение ресурсов для майнинга биткойнов
Давайте возьмем пример лотереи, в которой ваши шансы на выигрыш малы.Если люди покупают несколько лотерейных билетов и объединяют свои билеты вместе, это увеличивает их шансы на выигрыш. Если кто-то выигрывает в лотерее, то в зависимости от вклада вознаграждение распределяется между всеми участниками.
Пул майнинга биткойнов похож: несколько узлов разделяют свои ресурсы для майнинга блока. Когда блок решен, майнеры распределяют вознаграждение в зависимости от количества вложенной вычислительной мощности. Члены пула генерируют окончательное хеш-значение, затем биткойн-вознаграждение распределяется пропорционально между участниками в зависимости от ресурсов, которые они внесли.
Если вы посмотрите видеоурок Simplilearn по майнингу блоков, вы также можете увидеть демонстрацию с реальным блоком сети биткойнов, с номером блока и набором транзакций, которые являются частью блока. Вы также можете увидеть пример майнинг-пула, в котором участники делятся своими майнинговыми ресурсами, и вы можете увидеть как неподтвержденное вознаграждение, за которое они добывают, так и то, что они уже заработали.
Новичок в биткойнах и блокчейне и хотите узнать больше? Запишитесь на курс Simplilearn’s Blockchain Basics.Хотите получить сертификацию блокчейна для повышения резюме? Ознакомьтесь с учебным курсом по сертификации Blockchain.
алгоритмов интеллектуального анализа данных — 13 алгоритмов, используемых в интеллектуальном анализе данных
В нашем последнем руководстве мы изучили методов интеллектуального анализа данных . Сегодня мы изучим алгоритмы интеллектуального анализа данных.
Мы рассмотрим все типы алгоритмов интеллектуального анализа данных: подход на основе статистических процедур, подход на основе машинного обучения, нейронную сеть, алгоритмы классификации в интеллектуальном анализе данных, алгоритм ID3, C4.5, алгоритм ближайших соседей, алгоритм наивного байеса, алгоритм SVM, алгоритм ИНС, 48 деревьев решений, машины опорных векторов и SenseClusters.
Итак, приступим к алгоритмам интеллектуального анализа данных.
Что такое алгоритмы интеллектуального анализа данных?
Слишком много алгоритмов интеллектуального анализа данных. Мы обсудим каждую из них по очереди.
- Это примеры, в которых задачей анализа данных является Алгоритмы классификации в интеллектуальном анализе данных —
- Кредитный специалист банка хочет проанализировать данные, чтобы узнать, какой клиент является рискованным, а какой безопасен.
- Менеджер по маркетингу в компании должен проанализировать клиента с заданным профилем, который купит новый компьютер.
Почему алгоритмы используются в интеллектуальном анализе данных?
Вот причина, которая дает ответ использования алгоритмов интеллектуального анализа данных:
- В современном мире «больших данных» большая база данных становится нормой. Только представьте себе базу данных с большим количеством терабайт.
- Поскольку один только Facebook обрабатывает 600 терабайт новых данных каждый день.Кроме того, основная проблема больших данных — понять их смысл.
- Более того, проблема не только в огромном объеме. Кроме того, большие данные должны быть разнообразными, неструктурированными и быстро изменяемыми. Рассмотрим аудио- и видеоданные, сообщения в социальных сетях, 3D-данные или геопространственные данные. Данные такого типа нелегко классифицировать или систематизировать.
- Далее, для решения этой задачи, ряд автоматических методов извлечения информации.
Типы алгоритмов интеллектуального анализа данных
Здесь обсуждаются 13 алгоритмов интеллектуального анализа данных —
Алгоритмы интеллектуального анализа данных — Типы
а.Подход, основанный на статистических процедурах
Работа над классификацией состоит из двух основных этапов. Это может легко идентифицировать статистическое сообщество.
Вторая, «современная» фаза была сосредоточена на более гибких классах моделей. Во многих из которых должна быть предпринята попытка. Это дает оценку совместного распределения объекта внутри каждого класса. Это, в свою очередь, может дать правило классификации.
Как правило, статистические процедуры должны характеризоваться наличием точной фундаментальной вероятностной модели.Это раньше обеспечивает вероятность попадания в каждый класс, а не просто классификацию. Также можно предположить, что методы будут использоваться статистиками.
Следовательно, в отношении выбора переменных должно быть допущено некоторое человеческое участие. А также трансформация и общее структурирование проблемы.
г. Подход, основанный на машинном обучении
Обычно он охватывает автоматические вычислительные процедуры. Это было основано на логических или бинарных операциях. Это используется для изучения задачи из серии примеров.
Здесь мы должны сосредоточиться на подходах на основе дерева решений. Поскольку результаты классификации возникают из последовательности логических шагов. Эти результаты классификации способны представить наиболее сложную задачу. Такие как генетические алгоритмы и индуктивные логические процедуры (I.LP.) в настоящее время активно совершенствуются.
Кроме того, его принцип позволит нам иметь дело с более общими типами данных, включая дела. В котором количество и тип атрибутов могут различаться.
Этот подход направлен на создание классифицирующих выражений.Это достаточно просто для понимания человеком. И должен имитировать человеческое мышление, чтобы обеспечить понимание процесса принятия решения.
Как и статистические подходы, базовые знания могут использоваться в разработке. Но операция предполагается без вмешательства человека.
г. Нейронная сеть
Область нейронных сетей возникла из разных источников. Это варьируется от понимания и подражания человеческому мозгу до более широких вопросов. Это копирование человеческих способностей, таких как речь, и использование в различных областях.Например, банковское дело, в программе классификации для классификации данных как навязчивых или обычных.
Как правило, нейронные сети состоят из слоев взаимосвязанных узлов. Каждый узел производит нелинейную функцию своего входа. И ввод в узел может поступать из других узлов или непосредственно из входных данных. Также некоторые узлы идентифицируются с выходом сети.
Исходя из этого, существуют разные приложения для нейронных сетей. Это включает в себя распознавание закономерностей и принятие простых решений относительно них.
В самолетах мы можем использовать нейронную сеть в качестве основного автопилота. В каких единицах ввода считываются сигналы от различных приборов и единиц вывода. Это изменяет управление самолетом должным образом, чтобы он оставался на правильном курсе. Внутри фабрики мы можем использовать нейронную сеть для контроля качества.
г. Алгоритмы классификации в интеллектуальном анализе данных
Это одна из систем интеллектуального анализа данных. Это используется для анализа заданного набора данных и получения каждого его экземпляра. Он присваивает этот экземпляр определенному классу.Такой, что ошибка классификации будет наименьшей. Он используется для извлечения моделей. Это определяет важные классы данных в данном наборе данных. Классификация — это двухэтапный процесс.
На первом этапе модель создается с применением алгоритма классификации. Это на обучающем наборе данных.
Затем на втором этапе извлеченная модель проверяется на предварительно заданном наборе тестовых данных. Это необходимо для измерения производительности и точности обученной модели. Таким образом, классификация — это процесс присвоения метки класса из набора данных, метка класса которого неизвестна.
e. ID3 алгоритм
Этот алгоритм интеллектуального анализа данных начинается с исходного набора в качестве корневого концентратора. В каждом цикле подчеркивается каждый неиспользуемый атрибут набора и фигур. Это энтропия атрибута. В этот момент выбирает атрибут. Это наименьшее значение энтропии.
Набор S затем разбивается по выбранному атрибуту для получения подмножеств информации.
Эти алгоритмы интеллектуального анализа данных рекурсивно обрабатывают каждый элемент в подмножестве. Кроме того, учитываются только те предметы, которые ранее не выбирались.Рекурсия на подмножестве может остановиться в одном из следующих случаев:
- Каждый элемент в подмножестве принадлежит к одному классу (+ или -), тогда узел превращается в лист и
- с классом образцов
- Если больше нет атрибутов для выбора, но примеры по-прежнему не принадлежат к тому же классу. Затем узел превращается в лист и помечается наиболее распространенным классом примеров в этом подмножестве.
- Если в подмножестве нет примеров, то это происходит.Каждый раз, когда обнаруживается, что родительский набор соответствует определенному значению выбранного атрибута.
- Например, если не было примера сопоставления с метками> = 100. Затем создается лист, которому присваивается самый общий класс примеров в родительском наборе.
Рабочие шаги алгоритмов интеллектуального анализа данных следующие:
- Рассчитайте энтропию для каждого атрибута, используя набор данных S.
- Разделите набор S на подмножества, используя атрибут, для которого энтропия минимальна.
- Создайте узел дерева решений, содержащий этот атрибут в наборе данных.
- Рекурсия для каждого элемента подмножеств с использованием оставшихся атрибутов.
ф. C4.5 Алгоритм
C4.5 — один из наиболее важных алгоритмов интеллектуального анализа данных, используемый для создания дерева решений, которое является расширением предыдущего вычисления ID3. Это улучшает алгоритм ID3. То есть путем управления как непрерывными, так и дискретными свойствами, пропущенными значениями. Деревья решений, созданные C4.5. которые используются для группировки и часто называются статистическим классификатором.
C4.5 создает деревья решений из набора обучающих данных так же, как алгоритм Id3. Поскольку это алгоритм обучения с учителем, он требует набора обучающих примеров. Это можно увидеть как пару: входной объект и желаемое выходное значение (класс).
Алгоритм анализирует обучающую выборку и строит классификатор. У него должна быть возможность точно организовать как обучающие, так и контрольные примеры.
Тестовый пример — это входной объект, и алгоритм должен предсказать выходное значение.Рассмотрим примерный набор обучающих данных S = S1, S2,… Sn, который уже классифицирован.
Каждая выборка Si состоит из вектора признаков (x1, i, x2, i,…, xn, i). Где xj представляют атрибуты или особенности образца. Класс, в который попадает Си. В каждом узле дерева C4.5 выбирает один атрибут данных. Это наиболее эффективно разбивает свой набор выборок на подмножества, так что в результате получается тот или иной класс.
Условие разделения — это нормализованный информационный выигрыш. Это несимметричная мера разницы.Для принятия решения выбирается атрибут с наибольшим объемом информации. Общие рабочие шаги алгоритма следующие:
Предположим, что все образцы в списке принадлежат к одному классу. Если это правда, он просто создает листовой узел для дерева решений, чтобы этот конкретный класс выбрал.
Ни одна из функций не обеспечивает получение информации. Если это правда, C4.5 создает узел решения выше по дереву, используя ожидаемое значение класса.
Обнаружен экземпляр ранее невидимого класса.Затем C4.5 создает узел решения выше по дереву, используя ожидаемое значение.
г. K Алгоритм ближайших соседей
Правило ближайшего соседа различает классификацию неизвестной точки данных. То есть на основе его ближайшего соседа, класс которого уже известен.
М. Кавер и П. Э. Харт цель к ближайшему соседу (KNN). В котором ближайший сосед вычисляется на основе оценки k. Это указывает на то, сколько ближайших соседей необходимо учитывать для характеристики.
Он использует более одного ближайшего соседа для определения класса. Кому принадлежит данная точка данных и поэтому она называется KNN. Эти образцы данных должны быть в памяти во время выполнения.
Следовательно, они называются техникой, основанной на памяти.
Бейли и А. К. Джайн совершенствуют KNN, который ориентирован на веса. Очкам тренировки присваиваются веса. В соответствии с их расстояниями от точки выборки данных. Но в то же время вычислительная сложность и требования к памяти остаются первоочередной задачей.
Для преодоления ограничения памяти размер набора данных уменьшен. Для этого повторяются шаблоны. Не включающие дополнительные данные также исключаются из набора обучающих данных.
Для дальнейшего улучшения информационных фокусов, не влияющих на результат. Это дополнительно исключено из набора обучающих данных.
Набор обучающих данных NN может быть организован с использованием различных систем. Это для увеличения предела памяти KNN. Реализация KNN может работать с использованием шарового дерева, k-d дерева и ортогонального дерева поиска.
Обучающие данные с древовидной структурой далее делятся на узлы и методы. Такие как NFL и настраиваемая метрика делят набор обучающих данных по плоскостям. Используя эти алгоритмы, мы можем увеличить скорость базового алгоритма KNN. Учтите, что объект выбран с набором различных атрибутов.
Предполагается, что его группа может определить по его атрибутам. Кроме того, для автоматизации процесса классификации можно использовать различные алгоритмы. В псевдокоде алгоритм k-ближайшего соседа может выразить
K ← количество ближайших соседей
Для каждого объекта X в тестовом наборе выполните
вычислить расстояние D (X, Y) между X и каждым объектом Y в обучающем наборе
соседство ← k соседей в обучающей выборке, ближайших к X
Х.класс ← SelectClass (соседство)
Конец для
ч. Наивный байесовский алгоритм
Техника наивного байесовского классификатора основана на теореме Байеса. Он особенно используется, когда размерность входных данных высока.
Байесовский классификатор способен вычислять возможные выходные данные. Это основано на вводе. Также возможно добавлять новые необработанные данные во время выполнения и иметь лучший вероятностный классификатор.
Этот классификатор учитывает наличие определенного признака класса.Это не связано с наличием какой-либо другой функции, когда указана переменная класса.
Например, фрукт может считаться яблоком, если он красный, круглый.
Даже если эти функции зависят друг от друга, функции класса. Наивный байесовский классификатор считает, что все эти свойства вносят вклад в вероятность. Это показывает, что этот фрукт — яблоко. Алгоритм работает следующим образом:
Теорема Байеса предоставляет способ вычисления апостериорной вероятности P (c | x) из P (c), P (x) и P (x | c).Наивный байесовский классификатор учитывает влияние значения предиктора (x) на данный класс (c). Это не зависит от значений других предикторов.
P (c | x) — апостериорная вероятность класса (цели) с учетом предиктора (атрибута) класса.
P (c) называется априорной вероятностью класса.
P (x | c) — это вероятность, которая представляет собой вероятность предиктора данного класса.
P (x) — априорная вероятность предиктора класса.
и. SVM-алгоритм
SVM привлекла большое внимание в последнее десятилетие.Это также применимо к различным областям приложений. SVM используются для классификации обучения, регрессии или ранжирования.
SVM основан на теории статистического обучения и принципе минимизации структурных рисков. И иметь цель определить расположение границ принятия решения. Он также известен как гиперплоскость. Это обеспечивает оптимальное разделение классов. Тем самым создавая максимально возможное расстояние между разделяющей гиперплоскостью.
Кроме того, были доказаны экземпляры по обе стороны от него.Это необходимо для уменьшения верхней границы ожидаемой ошибки обобщения.
Эффективность SVM на основе не зависит от размерности классифицируемых сущностей. Хотя SVM — самый надежный и точный метод классификации. Также есть несколько проблем.
Анализ данных в SVM основан на выпуклом квадратичном программировании. Также дорого, как решение методов квадратичного программирования. Для этого требуются большие матричные операции, а также трудоемкие численные вычисления.
Время обучения SVM масштабируется по количеству примеров.Поэтому исследователи все время стремятся к более эффективному алгоритму обучения. В результате получился алгоритм, основанный на нескольких вариантах.
SVM также может быть расширен для обучения нелинейным функциям принятия решений. То есть сначала проецируя входные данные на многомерное пространство признаков. Как с использованием ядерных функций и постановкой задачи линейной классификации. В результате пространство объектов намного больше, чем размер набора данных. Это невозможно сохранить на популярных компьютерах.
Исследование этой проблемы приводит к нескольким алгоритмам, основанным на декомпозиции.Основная идея метода декомпозиции состоит в том, чтобы разделить переменные на две части:
набор свободных переменных, называемый рабочим набором. Это может обновляться в каждой итерации и наборе фиксированных переменных. Это исправлено во время определенного. Теперь эту процедуру нужно повторять до тех пор, пока не будут выполнены условия завершения.
SVM был разработан для двоичной классификации. И распространить его на задачу мультиклассовой классификации непросто. Основная идея применения мультиклассификации к SVM.То есть разложить мультиклассовые задачи на несколько двухклассовых задач. Это можно решить с помощью нескольких SVM.
J. Алгоритм ANN
Это типы компьютерной архитектуры, вдохновляющие биологические нейронные сети. Они используются для аппроксимации функций. Это может зависеть от большого количества входных данных и обычно неизвестно.
Они представлены как системы взаимосвязанных «нейронов». Это может вычислять значения из входных данных. Кроме того, они способны к машинному обучению, а также к распознаванию образов.Из-за их адаптивного характера.
Искусственная нейронная сеть работает, создавая связи между множеством различных элементов обработки. Каждый из них соответствует отдельному нейрону в биологическом мозге. Эти нейроны могут фактически создавать или моделировать с помощью цифровой компьютерной системы.
Каждый нейрон принимает множество входных сигналов. Затем на основе внутреннего взвешивания. Это производит единственный выходной сигнал, который отправляется на вход другому нейрону.
Нейроны связаны между собой и организованы в разные слои.Входной слой принимает входные данные, а выходной слой производит окончательный результат.
Обычно один или несколько скрытых слоев помещаются между ними. Эта структура делает невозможным прогнозирование или знание точного потока данных.
Искусственные нейронные сети начинают с рандомизированных весов для всех своих нейронов. Это означает, что они должны тренироваться, чтобы решать конкретную задачу, для которой они предлагаются. ИНС с обратным распространением информации обучается людьми для выполнения определенных задач.
Во время периода обучения мы можем проверить правильность вывода ИНС, наблюдая за шаблоном. Если это правильно, нейронные взвешивания производят усиление вывода. если результат неверен, эти ответственные веса уменьшаются.
Сеть, реализованная на одном компьютере, работает медленнее, чем традиционные решения. Параллельная природа ИНС позволяет создавать ее с использованием множества процессоров. Это дает большое преимущество в скорости при очень небольших затратах на разработку.
Параллельная архитектура позволяет ИНС обрабатывать объемы данных за меньшее время.Он имеет дело с большими непрерывными потоками информации. Например, распознавание речи или данные датчиков машины. ИНС могут работать быстрее по сравнению с другими алгоритмами.
Искусственная нейронная сеть полезна во множестве реальных приложений. Такие как распознавание визуальных образов и распознавание речи. Это касается сложных, часто неполных данных.
Кроме того, в последних программах преобразования текста в речь использовались ИНС. Многие программы анализа почерка в настоящее время используют ИНС.
К.48 деревьев решений
Дерево решений — это прогнозирующая модель машинного обучения. Это определяет целевое значение нового образца. Это основано на различных значениях атрибутов доступных данных. Внутренние узлы дерева решений обозначают различные атрибуты.
Кроме того, ветви между узлами сообщают нам возможные значения. Что эти атрибуты могут иметь в наблюдаемых образцах. В то время как конечные узлы сообщают нам окончательное значение зависимой переменной.
Атрибут прогнозирования известен как зависимая переменная.Поскольку его значение зависит от значений всех других атрибутов. Другие атрибуты, которые помогают предсказать значение зависимой переменной. Это независимые переменные в наборе данных.
Классификатор дерева решений J48 следует следующему простому алгоритму. Чтобы классифицировать новый элемент, сначала необходимо создать дерево решений. Это основано на значениях атрибутов доступных обучающих данных.
Итак, всякий раз, когда он встречает набор предметов. Затем он определяет атрибут, который наиболее четко различает различные экземпляры.
Эта функция может рассказать нам больше всего об экземплярах данных. Чтобы мы могли классифицировать их, считается, что лучшие из них имеют наибольший информационный выигрыш.
Теперь о возможных значениях этой функции. Если есть какое-либо значение, для которого нет двусмысленности. То есть экземпляры данных, подпадающие под его категорию. У него такое же значение для целевой переменной. Затем мы останавливаем эту ветвь и присваиваем ей полученное целевое значение.
Для других случаев мы ищем другой атрибут, который дает нам наибольший информационный выигрыш.Продолжаем получать четкое решение. То, какая комбинация атрибутов дает нам конкретное целевое значение.
В случае, если у нас закончатся атрибуты. Если мы не можем получить однозначный результат из имеющейся информации. Мы назначаем этой ветви целевое значение, которым владеет большинство элементов этой ветви.
Теперь, когда у нас есть дерево решений, мы следуем порядку выбора атрибутов, который мы получили для дерева. Проверяя все соответствующие атрибуты.И их значения с теми, которые видны в модели дерева решений. мы можем назначить или предсказать целевое значение этого нового экземпляра.
Приведенное выше описание будет более понятным и понятным с помощью примера. Следовательно, давайте посмотрим на пример классификации дерева решений J48.
л. Машины опорных векторов
Машины опорных векторов — это контролируемые методы обучения. Это используется для классификации, а также для регрессии. Преимущество этого заключается в том, что они могут использовать определенные ядра для решения проблемы.Таким образом, мы можем применять методы линейной классификации к нелинейным данным.
Применение уравнений ядра. Это упорядочивает экземпляры данных в многомерном пространстве. Что существует гиперплоскость, которая отделяет экземпляры данных одного вида от экземпляров другого.
Уравнения ядра могут быть любой функцией. Это преобразует неотделимые данные из одного домена в другой. В котором экземпляры становятся отделимыми. Уравнения ядра могут быть линейными, квадратичными, гауссовскими или любыми другими.Этим достигается именно эта цель.
Как только нам удастся разделить данные на две отдельные категории, наша цель — получить лучшую гиперплоскость. То есть разделить два типа экземпляров. Эта гиперплоскость важна, она определяет значение целевой переменной для будущих прогнозов. Мы должны выбрать гиперплоскость, которая максимизирует маржу. Это между опорными векторами по обе стороны от плоскости.
Опорные векторы — это те экземпляры, которые находятся либо на разделяющих плоскостях.Приведенные ниже пояснительные схемы прояснят эти идеи.
В машинах опорных векторов данные должны быть разделены, чтобы быть двоичными. Даже если данные не являются двоичными, эти машины обрабатывают их так, как если бы они были. Далее анализ завершается серией бинарных оценок данных.
M. SenseClusters (адаптация алгоритма кластеризации K-средних)
Мы использовали SenseClusters для классификации сообщений электронной почты. SenseCluster доступен пакет программ Perl.Поскольку он был разработан в Университете Миннесоты в Дулуте. Это мы используем для автоматической классификации текста и документов. Преимущество SenseClusters в том, что ему не нужны данные для обучения;
Он использует методы обучения без учителя для классификации доступных данных.
Теперь конкретно в этом разделе разберемся алгоритм кластеризации K-средних. Это использовалось в SenseClusters. Кластеризация — это процесс, в котором мы разделяем доступные данные. Это экземпляры заданного количества подгрупп.Эти подгруппы являются кластерами, отсюда и название «кластеризация».
Проще говоря, алгоритм K-средних описывает метод. То есть сгруппировать определенный набор экземпляров в K различных кластеров. Где K — положительное целое число. Следует заметить, что алгоритм кластеризации K-средних требует от пользователя ряда кластеров. Он не может определить количество кластеров самостоятельно.
Однако в SenseClusters есть возможность определять количество кластеров. Из чего могут состоять данные.
Алгоритм кластеризации K-средних начинается с размещения K центроидов. Затем каждому из доступных экземпляров данных необходимо назначить определенный центроид. Это зависит от таких показателей, как евклидово расстояние, манхэттенское расстояние, расстояние Минковского и т. Д.
Положение центроида должно пересчитываться каждый раз, когда экземпляр добавляется в кластер. Это продолжается до тех пор, пока все экземпляры не сгруппируются в окончательные требуемые кластеры.
Так как пересчет центроидов кластера может изменить членство в кластере.Кроме того, членство в кластере также проверяется после изменения положения центроида.
Этот процесс продолжается до тех пор, пока членство в кластере не исчезнет. И положение центроидов изменилось как можно меньше.
Таким образом, очень важно начальное положение центроидов. Поскольку эта позиция влияет на все будущие шаги в алгоритме кластеризации K-средних. Следовательно, всегда рекомендуется держать центры кластеров как можно дальше друг от друга.
Если кластеров слишком много, они похожи друг на друга. И они находятся в непосредственной близости друг от друга, и их нужно объединить в клуб.
Более того, если кластеров мало, значит кластеры слишком большие. И может содержать две или более подгруппы разных экземпляров данных, которые должны быть разделены.
Алгоритм кластеризации K-средних, таким образом, прост для понимания. Также метод, с помощью которого мы можем разделить доступные данные на подкатегории.
Итак, это все об алгоритмах интеллектуального анализа данных.Надеюсь, вам понравится наше объяснение.
Заключение
В результате мы изучили алгоритмы интеллектуального анализа данных.
Добавить комментарий