Подход Slope One

РефератПомощь в написанииУзнать стоимостьмоей работы

На вход алгоритм получает множество оценок всех пользователей (например как в таблице 2.1.), номер пользователя, для которого будут производиться рекомендации. Также на вход необходимо отправить левую и правую границу (и) оценки искомых фильмов, то есть, если мы хотим получить в качестве рекомендаций все фильмы с оценками от до, то левая и правая граница должны быть и соответственно. И последнее… Читать ещё >

Подход Slope One (реферат, курсовая, диплом, контрольная)

Slope One — это один из самых простых подходов к рекомендациям на основе коллаборативной фильтрации по схожести предметов, но в то же время точность рекомендаций алгоритма сравнима с более сложными и ресурсоемкими алгоритмами [6]. Он был разработан Даниелем Лемайром и Анной Маклахман в 2004 году и опубликован в 2005 году в статье [6].

Slope one будет использоваться в данном исследовании при проведении экспериментов для сравнения полученных результатов от подхода на основе узорных структур.

Метод Slope One работает с оценками объектов, полученных от пользователей. В нашем случае данные представляют собой оценки фильмов разными пользователями. Если — множество фильмов (в общем случае, вместо фильмов могут быть любые другие объекты), — множество пользователей, то оценки оценки пользователя данные различным объектам удобно представить таблицей:

Таблица 2.1. Оценки фильмов пользователями.


usermovie.	…	…
…	…
…	…	…	…
…	…
…	…	…	…
…	…

Каждый пользователь посмотрел некоторое количество фильмов и дал им свою оценку. Оценки могут быть целыми числами от до, или, если пользователь не смотрел фильм, то вместо оценки будет стоять, то есть отсутствие оценки.

Теперь перейдем непосредственно к алгоритму:

1) На вход алгоритм получает множество оценок всех пользователей (например как в таблице 2.1.), номер пользователя, для которого будут производиться рекомендации. Также на вход необходимо отправить левую и правую границу (и) оценки искомых фильмов, то есть, если мы хотим получить в качестве рекомендаций все фильмы с оценками от до, то левая и правая граница должны быть и соответственно. И последнее: необходимо задать минимальную и максимальную оценки (и), допустимые в нашей задаче. Здесь имеется в виду то, что если например алгоритм спрогнозировал для объекта оценку, а максимально возможная оценка, то мы должны понимать как .

2) В первую очередь находим множество всех фильмов оцененных пользователем .

3) Для каждого неоцененного фильма пользователем выполняем шаг 4), тем самым считая прогнозируемую оценку для фильма. После этого переходим к шагу 5).

4) Для каждого оцененного пользователем фильма, находим — множество пользователей, которые посмотрели фильмы и. В случае если множество непустое, то есть мощность множества, считаем отклонение: и добавляем к множеству номер .

После того, как подсчитаны все существующие отклонения, считаем прогнозируемую оценку:, где как уже было сказано выше. В случае, если множество пусто, спрогнозировать оценку невозможно.

5) К данному шагу алгоритм подсчитал все возможные прогнозируемые оценки для фильмов из множества .

Алгоритм рекомедует все фильмы с оценками, учитывая минимальную и максимальную допустимые оценки.

Здесь необходимо сделать замечание о том, что если нужно получить топ-N рекомендаций, то можно отсортировать все полученные прогнозируемые оценки для объектов по убыванию, и в качестве рекомендаций взять первые N объектов.

Модельный пример

Рассмотрим работу алгоритма Slope One на простом примере:

Таблица 2.2. Пример данных для Slope One.


usermovie

Попробуем предсказать оценку фильму .

1) Пусть, , и .

2) Находим — множество оцененных пользователем фильмов.
3)

5) С учетом максимальной допустимой оценки, алгоритм предсказывает оценку для фильма, и следовательно рекомендует посмотреть его пользователю .

Показать весь текст

Заполнить форму текущей работой

Другие работы

Возможности российских СПС и история их развития

При всех достоинствах электронные картотеки не позволяют знакомиться с полным текстом документов, поэтому более удобны полнотекстовые системы, дающие возможность не только практически моментально находить в громадных информационных массивах необходимый документ, но и работать с текстом найденного документа. В 1967 г. в результате соглашения между коллегией адвокатов штата Огайо и фирмой DATACorp…

Реферат

Подробнее...

Понятие Единой системы классификации и кодирования (ЕСКК)

В состав информационного обеспечения АСВОК входят: тезаурус; сводные эталонные файлы классификаторов; дополнительные эталонные файлы дополнений и исключаемых позиций; файлы поисковых образов позиций классификаторов; файлы незанятых позиций; таблицы сопряжения классификаторов; вспомогательный файл организаций, ответственных за ведение классификаторов; таблицы периодичности оповещения организаций…

Реферат

Подробнее...

Возможности и разновидности коммутаторов

Свичи подразделяются на управляемые и неуправляемые (наиболее простые). Более сложные свичи позволяют управлять коммутацией на канальном (втором) и сетевом (третьем) уровне модели OSI. Обычно их именуют соответственно, например Layer 2 Switch или просто, сокращенно L2. Управление свичем может осуществляться посредством протокола Web-интерфейса, SNMP, RMON и т. п. Многие управляемые свичи…

Реферат

Подробнее...

Визуализация информации туристической отрасли средствами Excel на примере туристской фирмы «Velvet Violet»

Основной текст страницы выполнен в бело-синем тоне, что подчеркивает направленность тура. Изменение цвета фона (Формат ячейки → Вид) делает текст более контрастным. Изменение цвета самого текста (кнопка) подобрано с точки зрения наилучшей сочетаемости и соблюдения общей стилистики оформления. В данном примере построена диаграмма, на которой показана динамика изменений цен. Диаграммы являются…

Реферат

Подробнее...

Поиск ремонтов. Проектирование и разработка базы данных и приложения "Техническое обслуживание станков" средствами СУБД Firebird

Запрос выбирает из REPAIR все ремонты, код вида ремонта которых равен заданному пользователем (параметр :rt_code определяется через выбранный элемент выпадающего списка). Второй запрос аналогичен этому, но вместо выборки всех ремонтов, удовлетворяющих условию, он вычисляет их общую стоимость: Данный пункт меню дает пользователю возможность просматривать зарегистрированные в системе ремонты…

Реферат

Подробнее...

Использование информационных технологий в преподавании информатики

Модернизация образования невозможна без внедрения в учебно-воспитательный процесс информационно-коммуникационных, компьютерных технологий. В настоящее время применение ИКТ становится актуальной составляющей в любом образовательном процессе, на любом уроке любого предмета и урок информатики без ИКТ представить уже невозможно. информационный педагогический презентация информатика По определению Н…

Реферат

Подробнее...

Алгоритм оптимального движения в транспортной сети

Модель транспортной сети Транспортная сеть (рис. 4) представляется топологической моделью в виде взвешенного графа G. Ребра графа соответствуют однородным сегментам транспортной сети, а узлы — точкам ветвления или иным точкам интереса (стартовым точкам, конечным точкам, точкам сети, ближайшим к заданному объекту и т. д.). Каждому ребру графа поставлено в соответствие значение временных затрат…

Реферат

Подробнее...

Описание объекта рекламы

Институт гуманитарного образования и спорта осуществляет подготовку специалистов, бакалавров и магистров. Включает в себя несколько кафедр, таких как: кафедра истории России, всеобщей истории, кафедра психологии развития, клиническая психология, кафедра физической культуры, кафедры иностранных языков, кафедра педагогики, кафедра теории и методики профессионального образования, кафедра режиссуры…

Реферат

Подробнее...

Сущность «дерева целей»

Идея метода дерева целей впервые была предложена У. Черчменом в связи с проблемами принятия решений в промышленности. Термин «дерево» подразумевает использование иерархической структуры, получаемой путём расчленения общей цели на подцели, а их, в свою очередь, на более детальные составляющие, которые в конкретных приложениях называют подцелями нижележащих уровней, направлениями, проблемами…

Реферат

Подробнее...

Распределенная магистраль. Топология локальных сетей

Обязательно следует учитывать тот факт, что рабочие станции пользователей очень редко бывают распределены по зданию удобным способом. Скорее всего, возникнет необходимость выделения в сети нескольких сегментов. Вполне вероятно, что некоторые сегменты будут расположены в непосредственной близости. Топологии локализованных магистралей следует планировать с особой тщательностью. Опрометчиво…

Реферат

Подробнее...

Проектная часть. Проектирование функциональной подсистемы автоматизированной информационной системы экономического объекта

В процессе описания постановки задачи важной является выверка точности и полноты названий всех информационных единиц. Четкость наименований информационных элементов и их идентификации, устранение синонимов и омонимов в названиях экономических показателей обеспечивают более высокое качество результатов обработки. Для каждого вида информации дается описание всех ее элементов в виде таблицы (табл…

Реферат

Подробнее...

Поддержка основных функций управления средствами workflow

Система управления может быть разделена на управляющую и управляемую подсистемы. Управляющая подсистема занимается выработкой управленческих решений. Управляемая подсистема является исполнителем этих решений. Важный показатель эффективности взаимодействия управляющей и управляемой подсистем — обратная связь. Обратная связь — это информация о результатах управленческого воздействия. Управляющая…

Реферат

Подробнее...

Как это выглядит

Итак, что же видит пользователь, зашедший в магазин? Во-первых, список товаров, находящихся на складе. Так как онлайновый «прилавок» как правило привязан к системе автоматизации какого-либо предприятия, то этот список содержит те же изделия, что имеются в продаже и в обычных (не виртуальных) магазинах. Содержимое склада представляется обычно в виде иерархической древовидной структуры, базовыми…

Реферат

Подробнее...

Photo Paint. Создание 3D-моделей в графических редакторах

Corel PHOTO-PAINT позволяет Вам просматривать и искать файлы, используя коллекцию clipart, фотографий, шрифтов, рамок, образцов и отображать списки. Кроме того, Вы можете найти содержание на Вашем компьютере, местной сети или Вебсайте поставщика оперативной информации онлайн. Найденное содержание Вы можете импортировать в свой документ, открыть его в связанном приложении или собрать его в лотке…

Реферат

Подробнее...

Охарактеризуйте СУБД. Работа программного обеспечения и периферийных устройств персонального компьютера

Объектом информатики выступают автоматизированные, основанные на ЭВМ и телекоммуникационной технике, информационные системы (ИС) различного класса и назначения. Информатика изучает все стороны их разработки, проектирования, создания, анализа и использования на практике. Информационные технологии (ИГ) — это машинизированные (инженерные) способы обработки семантической информации — данных и знаний…

Реферат

Подробнее...