Компании Greenplum и Aster Data Systems станут правильно использовать для анализа великих комплектов этих прямо-таки пионерскую технологию MapReduce (MR), скоро сделанную Google. Вполне возможно, что и Aster Data Systems и Greenplum, соперничающие с этими воистину солидными компаниями в области возведения хранилищ этих, как Oracle и Netezza, считают, что MapReduce может почтительно помочь им значительно улучшить в общем-то аналитическую обработку великих размеров инфы.
Greenplum устроила данный шаг опосля того, как Aster Data Systems робко предположила продукт In-Database MapReduce, который на данный момент очень-то доступен для оценки.
“Традиционно, СУБД с глобальным параллелизмом имели возможность распараллеливать исполнение обыденных SQL-операторов, хотя претерпевали какие-либо проблемы в работе с наиболее очень-то едиными програмками, прописанными или часто повторяющий вид функций, кратко характеризуемых юзерами, или как явно хранимые упражнения на языке PL/SQL, — добросовестно заметил руководитель фирмы Aster Маянк Бава. — Нередко эти фрагменты кода просто осуществлялись на одном узле СУБД с групповым параллелизмом. Честно говоря теперь специалисты и создатели крайне имеют все шансы широко пользоваться MapReduce в масштабах более-менее обыденного SQL, плавно творя функции SQL/MR на таковых языках, как Java, Python, R и так далие”.
Используя Greenplum MapReduce, фирмы лично имеют все шансы подробно писать MR-программы, которые при помощи нескольких строчек кода на языках Perl либо Python станут совсем готовы добросовестно обрабатывать и постоянно подвергать анализу по-особенному грандиозные размеры неструктурированных этих для нескольких прибавлений, в том числе поиск по ключевикам и индексирование контента, считает президент и сооснователь фирмы Greenplum Скотт Яра. Ну что же кроме того, быстро желая SQL полностью годится для решения множества задач анализа и по-особенному интеллектуальной обработки этих (data mining), есть много алгоритмов анализа и совсем машинного самообучения, которые невозможно воплотить в масштабах SQL, раздельно выделил он: “Хорошие образцы тому — байесовский расклад к просто-напросто машинному самообучению, методы кластеризации и работа просто-напросто с натуральными языками”.
Эффективность MapReduce в виде прибора для вполне корпоративной специалисты стала по-хорошему необыкновенно злободневной темой по вопросу тем, что прекрасно набирают силу так-называемые “более-менее пасмурные” вычисления. Поверьте эксперт фирмы Gartner Дональд Файнберг считает MapReduce довольно ненамного трудоемким прибором, хотя при всем этом он прибавляет, что данная разработка лично имеет возможность охотно отдать фирмам вероятность слишком проворно умышленно обрабатывать очень великие комплекты этих: “Она настоятельно просит довольно изощренного программирования. Предположим это абсолютно не то, что по-человечески обыкновенные создатели сообщают на SQL, правильно используя SQL-вызовы в Cи, Java или же иных языках”.
Президент Monash Research Курт Монаш помимо прочего считает MapReduce в целом сильным прибором для манипулирования данными и их анализа: “Компании, которые интегрируют MapReduce и SQL, расширяют область использования данных приборов и поспешно предоставляют создателям и админам баз этих вероятность развивать инфраструктуру просто-таки параллельной обработки этих”.
Вы должны быть зарегистрироавны чтобы оставить комментарий.