Курсы по машинному обучению от Яндекс

Каникулы – хорошее время не только для отдыха, но и для самообразования. Можно отвлечься от повседневных задач и посвятить несколько дней тому, чтобы научиться чему-нибудь новому, что будет помогать вам весь год (а может и не один). Поэтому мы решили в эти выходные опубликовать серию постов с лекциями курсов первого семестра Школы анализа данных.

Continue reading →

Big Data: Backup делать нельзя работать без него

За время работы администратором баз данных я выработал для себя одно правило, которого придерживаются многие DBA. Это «золотое» правило всех администраторов баз данных – не делай ничего серьезного с базой данных, если у тебя нет бэкапа. Если ты собрался серьезно изменить параметры базы данных, провести операции по техническому обслуживанию базы данных и т.п. – то всегда перед этим надо выполнить операцию резервного копирования. Этот принцип достаточно долго работал и оправдывал себя, и даже в нескольких случаях помогал восстановить базу данных на определенный момент времени.
Continue reading →

Возможности работы с пространственными данными в пакете R

Краткая описание возможностей R по работе с пространственными данными

R — бесплатный, свободно распространяемый и очень активно развивающийся статистический пакет. Благодаря своей гибкости, настраиваемости и открытом коду пакет практически признан стандартом де-факто и используется в огромном количестве проектов, учебных учреждений, компаний. Параллельно основному пакету, энтузиастами разрабатываются сотни дополнительных модулей для каждого направления статистики.

До недавнего времени главной проблемой было наведение «моста» между самими пространственными данными и той массой аналитических возможностей, предоставляемой R. Новые пакеты осуществляющие импорт/экспорт данных максимально облегчили этот переход.

Continue reading →

Что такое R-project? Начала

ДАННЫЕ → ИНФОРМАЦИЯ → ЗНАНИЯ

(Уточните понятия в Википедии, пройдя по ссылкам)

Таковы этапы познания — от зафиксированных фактов, через классификацию и структуризацию к конструктивным механизмам прогнозирования. Здесь разговор пойдет о том, что называют Data mining, Big data, Business Intelligence о том, что связывают с большими наборами цифр, из которых можно извлечь некую ценность. Такой разговор предполагает, что читатель более или менее знаком с основными понятиями теории вероятностей и математической статистики и может научиться делать то, о чем он прочитает в руководствах по эксплуатации R. Без знания, что такое математическое ожидание, дисперсия случайной величины, среднеквадратическое отклонение, квантиль, медиана (статистика) и прочее, прочее, прочее читать эти руководства крайне затруднительно.

hpgraphic[1]
Continue reading →