Вы можете прислать нам новости или сообщить что-то очень важное заполнив форму.

Print Friendly, PDF & Email

Рекомендации книг

22 апреля, 2014

Почему рекомендовать книги сложно, хотя это ни к чему не обязывает?

Отвечает: Анна Бабяшкина – главный редактор проекта ReadRate

Давать книжные рекомендации только выглядит легкомысленным и ни к чему не обвязывающим делом. Ведь если мы рекомендуем человеку книгу, которая ему не понравится, мы рискуем потерять его доверие. ReadRate старается выстраивать долговременные отношения с пользователем, и как синоптики мы ошибаться не можем.

Человек тратит на чтение, пожалуй, самый ценный и невосполнимый ресурс — драгоценное время. Книг очень много, времени на чтение у нас сегодня все меньше, а книги часто  разочаровывают. По статистике из 30 открытых книг сегодня дочитываются до конца лишь 9. 14 из них разочаровывают читателя уже с первых страниц и их бросают в самом начале. Еще 7 книг поначалу увлекают читателей. Многие успевают прочесть треть, а то и половину произведения, прежде чем потеряют к нему интерес.

Теперь вы понимаете, как сложно сориентироваться в огромном океане книг и выбрать те, с которыми возникнет любовь с первой строчки?

Поэтому мы очень тщательно продумываем, какие произведения предложить пользователям нашего сервиса ReadRate.

Сервис ReadRate.com предлагает несколько способов получить книжные рекомендации. Во-первых, у нас работает сервис автоматических персональных рекомендаций, которые формирует машина. Во-вторых, каждую неделю ReadRate готовит редакционные и звездные рейтинги.

Автоматические рекомендации, которые дает ReadRate, учитывают множество факторов: пол и возраст пользователя, какие книги человек уже прочитал и как он их оценил, какие книги пользуются популярностью среди его друзей и пользователей сервиса в целом. Во внимание принимается даже сезонный фактор. Все для того, чтобы человек встретился именно с той книгой, которую ему захочется дочитать до конца.

Тем, кто не очень доверяет машинам, мы предлагаем наши редакционные тематические рейтинги. Первоначально книги для них отбирают вручную очень начитанные редактора ReadRate. Затем они оценивают, насколько популярны выбранные книги, часто ли их скачивают и дочитывают ли до конца, либо бросают читать с первых строчек. В результате появляется список книг, которые имеют высокие шансы понравиться читателю.

Плюс вы можете посмотреть на ReadRate, что читает ваш любимый актер, режиссер, писатель или спортсмен и выбрать книгу из его личной библиотеки.

Хотела также добавить, что чем больше людей пользуются сервисом и делятся своим мнением и оценками прочитанного, тем точнее становятся наши рекомендации. Мы приглашаем вас на ReadRate.com, чтобы с нашей помощью ваше чтение становилось более «прицельным», а наш сервис благодаря вашему участию становился все лучше.


 
 

Комментарии к сообщению “Рекомендации книг”

  1. Nait:

    Спасибо за статью,
    http://readrate.com — интересный ресурс.

  2. Lecron:

    Внешне простая, но внутри чудовищно сложная работа, требующая немалых усилий. Действительно, ПРАВИЛЬНО рекомендовать книги очень сложно. Под «правильно» я понимаю так — ни одна из рекомендованных книг не окажется заброшена или в крайнем случае, не более одной из десятка. Иначе, какая же это рекомендация? Это просто тыканье пальцем в небо, лишь приблизительно в нужном направлении. Треть окажется нейтральна — прочтена пусть и без воодушевления, но и без раздражения (6 баллов); половина, в той или иной мере понравится (более 6 баллов); остаток тоже не будет заброшен, хоть и прочтен с некоторыми отрицательными эмоциями (4-5 баллов).
    Только для этого надо иметь не только хорошую математику, но и очень большое количество участников с большим количеством оценок. Тысячи людей с более 300 оценок и десятки тысяч с более 100 оценок. Более того, оценивающих правильно. Использующих всю шкалу, а не только 1 или 10, и некую нормальность распределения. Ну не работает статистика на малых и тем более «кривых» объемах. Не работает.
    И даже этого, для грамотной рекомендации мало. Нужны не только оценки, но и каталогизация со стороны редакции, позволяющая характеризовать сам текст. Простановка не только основных — жанра и поджанра, но и прочих характеристик — направления сюжета, места и время действия, тип развития сюжета. И это только по сюжету, а есть еще стиль. Количество диалогов (действия) и описательной (атмосферной) части, общая длинна текста и средняя длинна предложения, и многое другое.
    Если таковой анализ будет идти не только по отдельной книге, но еще и учитывать отношение к другим книгам в данной серии/цикле — точность еще возрастет, правда вместе со сложностью анализа.

    Пока я еще не встречал ни одного ресурса с хорошими релевантными рекомендациями. Возможно получится у ReadRate, но если честно, то сомневаюсь.

  3. За тематические рейтинги большое спасибо. А в статистический расчет рекомендаций я все равно не поверю. Если мне понравился «Робинзон Крузо», из этого совершенно не следует, что мне понравятся, скажем, «Приключения капитана Сингльтона» того же автора. Мой лучший друг, который знал меня десятки лет, с которым у нас списки любимых книг совпадали процентов на девяносто пять, несколько раз советовал мне, что почитать, а я советовал ему. Черта с два. Никаких девяноста пяти процентов. В лучшем случае одна из трех-четырех нравилась нам обоим.
    Я так думаю, что ложна сама мысль о том, что есть хоть какая-то связь между понравившимися читателю книгами.

    • А вы проверьте. Посоветует ли ReadRate то, что вы предположили. 😀

    • Lecron:

      Конечно рекомендовать только по автору нельзя. И рекомендации одного человека даже с похожими вкусами тоже не показатель. Но поверить гармонию алгеброй вполне реально, с достаточно высокими шансами на успех.
      Если во всех имеющихся на ресурсе книгах оценить
      а) стиль по сотне параметров (например так),
      б) смысл по еще десятку двум параметров (например так. Не уверен что отобразится без регистрации)
      в) наложить на матрицу оценок тысяч пользователей, проставивших сотни оценок, из которых как минимум несколько сотен оценило конкретно взятую книгу (на меньших масштабах статистика не работает), при этом
      г) с учетом методик оценок каждого конкретного пользователя (кто-то оценивает только 1 и 10, кто-то 8,9,10 и при этом оценка 8 ставится для рядовой по их мнению книги), нормировав оценку к некоему единому стандарту,
      и вот если этот вектор, на пару сотен измерений «перемножить» на ваш профиль и на каждую книгу из доступных — прогоз получится почти достоверный.

      Но, повторяю, прогноз по 200-ам и более количеству измерений, а не только по 1-му параметру, по средней оценке книги от других читателей. Все остальные прогнозы — здеж и шарлатанство.

      • Не могу согласиться. Если бы подобный «расчет» стиля и чего-то там еще действительно имел смысл, то мы ценили бы в писателях не оригинальность и самостоятельность, а следование удачному образцу. Но мы-то знаем, что есть, скажем, Дюма, а о каком-нибудь Поле Махалене, имитировавшем стиль Дюма и продолжившем историю трех мушкетеров, и знать ничего не хотим. И заслуженно. Но мы-то знаем «Франкенштейна» Мэри Шелли, а подделку Сьюзен О’Киф читать не собираемся. Заметьте, другие книги самой Шелли нам тоже почти неинтересны, хотя объективные писательские характеристики остались все те же. Или еще. Есть гениальные Стругацкие и есть по-своему неплохие фантасты Рыбаков, Лазарчук, Лукьяненко… Но когда эти последние начинают во «Времени учеников» копировать первых, получается такая чушь, что все статистические коэффициенты идут к чертям собачьим.

        Что же касается сопоставления оценок, выставленных разными пользователями, я уже приводил пример, когда у нас с товарищем могут совпадать оценки любимых книг, но рекомендации все равно не работают.

        Вы исходите из предположения, что оценки книг объективны. А они не. Объективность — современное суеверие людей с техническим образованием.

        • viktorz:

          Компания Netlfix обладает алгоритмами, которые предсказывают оценку пользователем фильма (от 1 до 5) с точностью, характеризуемой среднеквадратичным отклонением 0.86. Так что такие расчеты в принципе работают, это факт. Нет никаких причин, почему бы такому подходу не работать и с книгами. Только это технически сложная задача, та же фирма Netlfix уплатила приз в $1000000 за улучшение точности всего на 10%. С историей вопроса можно подробнее ознакомится здесь: http://en.wikipedia.org/wiki/Netflix_Prize
          Так что для того, что бы получить такие же точные предсказания для книжек, нужна самая малость – чтоб за это взялась столь же богатая компания как Netflix. Доход компании Netflix в 2013 году – 4.37 млрд долларов, число пользователей – 40 млн… Большой привет проекту ReadRate…

          • Lecron:

            Ср.кв.отклонение 0.86 при 5-бальной системе оценок? То есть почти балл? Это пальцем в небо. От «так себе» (2 балла) до «хорошо» (4 балла) или от «не стоит смотреть» до «можно посмотреть». И то, лишь с вероятностью 70%. И еще 30% — что отклонение будет 1.7 балла. То есть почти вся шкала — от «не стоит смотреть» до «отлично».
            Даже у компании с миллионными вложениями — дела не очень. Для нормальных дел, отклонение не должно превышать 10% от максимальной величины рейтинга.
            Что впрочем не опровергает возможность качественных рекомендаций как таковых. Когда-то потом. В будущем.
            Пока же стоит к ним относится не как к рекомендации к прочтению (просмотру), что мы обычно ожидаем от таких рекомендаций, мол ты должен это обязательно прочесть, тебе должно понравится, а лишь как к совету — просто обратить внимание на эту книгу (фильм) и оценить их подходящесть своими привычными методами.

            • Тотальное большинство рекомендательных систем построены на системе продаж. То есть, они вычисляют не только пристрастия, но и вероятность того, что человек купит контент. Поэтому 1 бал – это 80% уверенность в том, что человек купит! А это очень много! Особенно с учетом того, что очень небольшое количество товаров человек купит со 100% уверенностью, даже соль или молоко. Всегда есть вероятность, что пройдет мимо полки. Рекомендательный сервис заряжает уверенностью – не пройди мимо, купи! 😀

              • Lecron:

                Не понял. А последнее предложение и вовсе вводит в уныние. То есть «Рекомендация» это ни только не явное указание на необходимость прочтения, и даже не совет, просто посмотреть в эту сторону, а банальная, слегка таргетированная реклама, мол ты купи, авось понравится.
                А среднеквадратичное отклонение 0,86 на диапазоне 3±2, это очень и очень много для того, чтобы являться рекомендацией. Фактически это означает, что я могу тупо назвать предполагаемую оценку пользователя равной 3, для абсолютно всех позиций, и при нормальном распределении оценок, почти вписаться в эту сигму.

                • Зайдем с другой стороны. Есть 100% (5 звезд по 20%). Какой планшет вы мне порекомендуете с учетом того, что он мне понравится на 5 звезд (на 100%)?

                • Lecron:

                  Пример неправильный. Расскажите мне ваше мнение о нескольких десятках планшетов и я должен угадать ваше отношение к тем моделям про которые вы мне ничего не говорили. А еще лучше, чтобы о нескольких десятках планшетов рассказали мне еще пара тысяч пользователей.
                  Именно в этом суть рекомендательного сервиса. Зная ваш «психопрофиль» и еще кучу доступных статистических параметров, он должен произвести корреляцию и указать вашу предполагаемую оценку.
                  На данный момент, она почти не коррелирует с вашей реальной оценкой после прочтения. Для сравнения, что означает 0,86 (в моем случае 0.84) при 5-бальной шкале. Это допустимое отклонение на 1 балл, всего с 30% точных попаданий в прогноз. Что для шкалы:
                  1- не стоит смотреть
                  2- так себе
                  3- можно посмотреть
                  4- хорошо
                  5- отлично.
                  очень и очень много. Слишком большой шаг. Слишком сильно разнится впечатление от произведений описываемых соседними оценками, что бы позволить 70% промахов в 1 балл.
                  Нельзя это считать доверенной рекомендацией. Для такой шкалы, сигма не должна превышать 0.5. Что будет означать точное попадание в 33%, отклонение всего в пол-балла для 57% случаев и только 10% для отклонения в 1 балл.
                  Вот тогда это рекомендательный сервис, а не пальцем в небо.

                • Неправильный пример? Приведите правильный. При каких условиях ваш прогноз окажется с вероятностью 100% (5 звезд)? Сколько книг мне надо перечислить, чтобы Вы угадали? 😀

                • Lecron:

                  Уже привел выше. Полного и тем более гарантированного угадывания добиться нельзя. Но должна быть определенная точность и кучность стрельбы.

                  Возможно мы под понятием «рекомендация» понимаем разные вещи. Для меня, это «бери, смотри, и больше никого не слушай и ни на что не обращай внимания», а для кого-то, как и для самого рекомендательного сервиса это может оказаться «глянь на это, прикинь, почитай что про него пишут, посмотри трейлер, а если заинтересует, тогда можешь смотреть».
                  В моем случае, 0.86 на диапазоне 3±2, это недостаточная кучность для качественных рекомендаций. Очень большой разброс, чтобы просто последовать такой рекомендации.
                  Достигни они такого отклонения на шкале от 1 до 10 — я бы первый поаплодировал.

                • Вы посмотрите ссылку victorz… там есть объяснение принципа.

                • Lecron:

                  И? Что я нового могу там увидеть?
                  Задача алгоритма: предсказать мою оценку (algorithm to predict user ratings for films). Все остальное — дополнительные условия, которые меня не интересуют. Мне неважно какие он возьмет данные и как будет им манипулировать. Важен результат.

                  Лично для меня, при любой шкале, есть некая прогнозная оценка, выше которой я считаю фильм годным к просмотру. При 5-бальной шкале, я могу смирится с тем, что результат будет хуже этой оценки до 0.5 балла; не критично, но уже заметно разочарует падение до 1 балла (это эмоциональная разница между «зря потраченное время» и «можно посмотреть»); буду совсем недоволен при падении больше 1 балла.

                  Так вот, сервер мне предложил некую оценку и она меня устроила. Но предсказал он мне её с СКО равным 0.86. То есть:
                  с вероятностью 50% оценка будет равна или больше; 35% оценка будет хуже прогноза, вплоть до 2.14 балла; 15% что оценка будет от 1.3 до 2.1.
                  То есть, получу фильм нужного мне уровня где-то с вероятностью 72%, 15% что буду некритично разочарован и 10% что он меня вообще полностью не устроит.

                  В общем неплохой результат прогноза. Но. Это лишь совет, требующий перелопатить еще кучу инфы, что бы понять стоит оно того или нет.
                  На рекомендацию в моем понимании, то есть на ориентировку лишь по этой цифре, прогноз не тянет. Для этого нужно СКО=0.5, чтобы получить 85% — устраивает и лучше; 13% — некритичное разочарование и всего 2% на полное разочарование.

                  Еще раз, последствия ошибки в прогнозе, в таком виде, для СКО 0.86 и для 0.5 при моем подходе к 5-бальной шкале:
                  Фильм устроил — 72% против 85%
                  Фильм разочаровал — 15 против 13%
                  Фильм неугодил — 10 против 2%
                  Я не знаю как еще объяснить свое мнение. Первые цифры — это намек на просмотр и не более, вторые — рекомендация, которую стоит принять к исполнению.

  4. Kromanion:

    Самая нормальная система рейтингов — когда человек с определенным вкусом подбирает книги для людей, обладающих похожим вкусом. Или просто пишет адекватные отзывы.
    Механический подсчет рейтингов ничего не дает.
    Поскольку школота (в худшем своем проявлении) и домохозяйки, у которых больше всего времени, выводят в топ всякую дрянь, заражая, как болезнью или обмазывая этим дерьмом, как хотите, всех встречных и поперечных.
    Практически не читаю и не учитывая рейтинги на сайтах, это бессмысленно.
    Для себя давно сделал вывод — весь мейнстрим — это фуфло, и практически чем позже книга попала в мейнстрим, тем фуфлее.
    Потому что читатель охотно деградирует. Кстати, я тоже охотно деградирую, увы 🙂
    Понимаете, литературная критика это тоже профессия. Ну есть такая профессия — литературный критик. И как компьютер с программой генератора текста не способен заменить писателя, так и сайт с автоматическим подсчетом рейтингов не способен заменить критика. Посмотрите, к чему рейтинги довели — в топах всякая шушера ошивается, не владеющая языком даже на уровне пятерочного школьного сочинения, с ворованными сюжетами, которые даже и сплагиатить толком не могут, пейсатели с полным отсутствием фантазии и грамотности.
    Например, колонка отзывов на либрусеке пролистывается мною бегло, все эти мастриды, прачетал на адном дыхании, а также все политические холивары идут в топку. Только когда глаз спотыкается на чем то более менее грамотно написанном, я вчитываюсь в отзыв, и потому уже примеряю, интересно не интересно.
    Но это не значит, что литература с низкими требованиями и ожиданиями, не должна существовать. Просто нормальный критик, тот, который нужен, должен обозревать в таком ключе: типичная фэнтези но со следующими и следующими особенностями, нетипичный детектив, альтернативка с неуклюжим языком и плохим знанием предмета, или наоборот, альтернативка с хорошим язком и хорошим знанием предмета со следующими особенностями. Подобные колонки существовали на фантлабе одно время, и были интересны читателям, или потенциальным читателям. Потом деградировали. И перекатились в некую нишу рекламы литературы не для всех. Половина рецензий написано таким умным языком, что там надо научный словарь под рукой держать, вкупе со словарем иностранных слов, чтоб понять приблизительно, что говорится в рецензии. А по мне, здесь должно быть разнообразие: В качестве такого критика, как мне кажется может выступать и школьник, и рекомендовать соотвествующие книги для тех, кому это интересно, отдельно по детским книгам для малышей, отдельно по любовным романам, наконец, и так далее, по детективам, по твердой НФ 80-х. Каждому поколению, каждому жанру должен соответствовать человек с определенным литературным вкусом.
    Что же я виде на http://readrate.com? Я вижу там тупо рекламу того мэйнстрима, что сейчас издают. Что ставит этот типа рейтинговый сайт в очередной ресурс из миллионов в нете, которые существуют за счет крошек с барского стола, сиречь за счет средств, отпускаемых издательством на пеар. Такой мутью инет кишмя кишит, всеми этими рейтингами, горячими десятками, двадцатками и т.д. И все они пребывают в безвестности, потому что таких «умных» тоже миллион, не меньше чем прочих рекламных агентств.

    • Lecron:

      Журнал «Мир фантастики». Вполне качественные рецензии. Мнение о книге складывается на раз.

      • О! Заметьте, рецензии. А не рекомендации. Рецензии имеют право на существование. По ним можно составить впечатление о книге. Желательно, конечно, учитывать еще, кто ее написал. Если автор рецензии правильный, то прочтение рецензии можно приравнять к пролистыванию книжки, случайно взятой с магазинной полки.

      • Kromanion:

        Рецензии то качественные, только вот не фантастикой единой живем. Хотелось бы охвата и других жанров.

  5. Дмитрий:

    Для меня ресурс Имхонет оказался самым адекватным. По мере заполнения индивидуального профиля , рекомендации стали точнее. И они не говорят о 100% попадании. Они указывают, что книга вам понравится с вероятностью 8 или 9 баллов. Благодаря их рекомендации, открыл для себя ряд авторов.

    • Везет. Я в свое время выставил на Имхонете 422 оценки, написал 52 отзыва. Тогда я получил совершенно нелепые рекомендации, вроде Эллери Квина (я детективы вообще не читаю) и Дика Френсиса, которого я терпеть не могу. Да еще Похлебкина и Жванецкого, которых я издалека уважаю, но читать никогда не собирался.
      Сегодня зашел посмотреть еще раз, что там появилось новенького. Кроме ужасного плиточного интерфейса a-la mobile, появились рекомендации мне почитать Дину Рубину, Льюиса («Хроники Нарнии»), какого-то Хантера Томпсона и, ни к селу, ни к городу, «Отца Сергия» Льва Толстого. Это настолько не лезет ни в какие рамки, настолько не сочетается с моими вкусами, что я еще сильнее уверился в том, что Имхонет это всего лишь рекламный стенд книжных издательств. А алгоритмы вычисления рекомендаций он, видимо, вообще отключили, чтобы не уменьшали охват аудитории.

      • Kromanion:

        Они лучше знают, что вам читать 🙂 Вы даже не подозреваете в себе тайной страсти к детективу, а штатный психолог уже все вычислил и прописал в качестве лекарства по одному детективу в день 🙂

      • Kromanion:

        Интересно было бы узнать причины такого отношения к Фрэнсису, который пишет детективы, которые Вы не читаете. То есть все-таки Вы читаете детективы, иначе откуда бы вам знать как именно пишет Фрэнсис.
        Не являясь фанатом Фрэнсиса, могу сказать, что вообще-то закулисный мир скачек у него прописан здорово, наверно, он все-таки знает, о чем пишет. Если выйти за пределы антуража несколько однотипные клоны, на добротном бытовом уровне прочитал-забыл. Причин для обожания нет, разве только вам безумно нравится давно клишируемый образ простого-парня-из-народа-восстанавливающего-правосудие. Ну и причин для «терпеть не могу» тоже вроде не видно. Поэтому любопытствую, извините.

        • Ну, предположим, с «терпеть не могу» я погорячился :). Но отчетливая неприязнь есть. Уже и не помню, почему, читал давно, но наверное, как раз из-за скачек и тотализаторов. Я бы точно так же не полюбил роман о казино (помнится, Штемлер собирался писать, но потом сказал, что побрезговал) или о шулерах.



Вы можете прислать нам новости или сообщить что-то очень важное заполнив форму.