Дуг Каттинг - Doug Cutting

Дуг Каттинг

Дуглас Рид Резка разработчик программного обеспечения, защитник и создатель Открытый исходный код поисковая технология. Он основал Lucene и с Майк Кафарелла, Nutch, оба проекта технологии поиска с открытым исходным кодом, которые теперь управляются через Фонд программного обеспечения Apache. Cutting и Cafarella также являются соучредителями Apache Hadoop.[1]

Образование и начало карьеры

Резка держит степень бакалавра из Стэндфордский Университет.[2]

До разработки Lucene Каттинг занимал должности в сфере поисковых технологий в Xerox PARC где он работал над алгоритмом Scatter / Gather[3][4] и по вычислительным стилистика.[5] Он также работал в Возбудить, где он был одним из главных дизайнеров поисковый движок, и Apple Inc., где он был основным автором V-образный твин рамки текстового поиска.[6]

Проекты с открытым исходным кодом

Lucene, индексатор поиска и Nutch «Паук» или «краулер» - это два ключевых компонента общей поисковой платформы с открытым исходным кодом, которая сначала сканирует Интернет в поисках контента, а затем структурирует его в поисковый индекс. Руководство Cutting в этих двух проектах расширило концепции и возможности общих проектов программного обеспечения с открытым исходным кодом, таких как Linux и MySQL в вертикальную область поиска.[7] В статье 2017 года Каттинг цитировался с заявлением: «Открытый исходный код является требованием для бизнеса».[8]

Использование парадигмы MapReduce

В декабре 2004 г. Google Research опубликовала статью о Уменьшение карты алгоритм, который позволяет тривиально распараллеливать очень крупномасштабные вычисления на больших кластерах серверов. Резка и Майк Кафарелла, осознавая важность этой статьи для расширения Lucene в сферу чрезвычайно больших проблем поиска, создал открытый исходный код Hadoop рамки что позволяет приложениям на основе Уменьшение карты парадигма для работы на больших кластерах массового оборудования. Каттинг был сотрудником Yahoo!, где он возглавил Hadoop проект на полную ставку. Позже он продолжил работу в Cloudera.[9]

Фонды и награды с открытым исходным кодом

В июле 2009 года Каттинг был избран в совет директоров Apache Software Foundation, а в сентябре 2010 года он был избран его председателем.

В 2015 году О'Рейли награжден награда за открытый исходный код к резке.[10]

Рекомендации

  1. ^ Cutting, Майк Кафарелла, Бен Лорика, Дуг (31.03.2016). «Следующие 10 лет Apache Hadoop». O'Reilly Media. Получено 2018-04-16.
  2. ^ "Команда менеджеров Cloudera". Cloudera. Получено 2016-08-17.
  3. ^ Каттинг, Дуглас Р., Дэвид Р. Каргер, Ян О. Педерсен и Джон В. Тьюки. «Разброс / сборка: кластерный подход к просмотру больших коллекций документов». SIGIR '92 Материалы 15-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска. (Перепечатано в ACM SIGIR Forum, том 51, № 2, стр. 148–159. ACM, 2017.)
  4. ^ Педерсен, Ян О., Дэвид Каргер, Дуглас Р. Каттинг и Джон В. Тьюки. «Скаттер-сборка: кластерный метод и устройство для просмотра больших коллекций документов». Патент США 5442778, выдан 15 августа 1995 г.
  5. ^ Карлгрен, Юсси; Резка, Дуглас. «Распознавание текстовых жанров с помощью простых показателей с помощью дискриминантного анализа».. Труды 15-й конференции по компьютерной лингвистике. Том 2. Ассоциация компьютерной лингвистики, 1994.
  6. ^ «Поисковая система Lucene: мощная, гибкая и бесплатная». JavaWorld. 2000-09-15. Получено 2017-01-25. Каттинг является основным автором поисковой системы V-Twin (часть разработки операционной системы Apple Copland) ...
  7. ^ "Википедия: На основе Lucene". Lucene. Получено 5 сентября, 2007.
  8. ^ «Дуг Каттинг,« отец »Hadoop, рассказывает об эволюции технологий больших данных». ComputerWeekly.com. Получено 26 июня, 2018.
  9. ^ Хенди, Алекс (10 августа 2009 г.). "Создатель Hadoop переходит к Cloudera". Время разработки программного обеспечения. Архивировано из оригинал 13 марта 2012 г.. Получено 2011-03-22.
  10. ^ «Награда O'Reilly Open Source Awards - OSCON 2015». YouTube. О'Рейли. Получено 27 июля 2015.

внешняя ссылка