Как это работает

В первую очередь система обращается к списку фраз, собранному специально для ее работы. Сейчас список содержит 965 записей, полностью его можно посмотреть по ссылке.

Если фраза не найдена в списке, программа обращается к поиску по прозаическим текстам на сайтах books.google.com и ficbook.net и, если фраза встречается более четырех раз в разных текстах — система сообщает пользователю "Фраза "такая-то" скорее всего, — литературный штамп или другой вид устойчивого сочетания слов" и записывает ее в промежуточную базу данных для дальнейшей обработки и помещения в список.

Возможно, что поиск точной фразы по базе или текстам не возвращает результатов, в таком случае, программа разбивает фразу на слова, исключает из нее служебные части речи и местоимения и производит повторный поиск. Если поиск возвращает результаты, в которых слова фразы стоят на расстоянии не более трех слов друг от друга, система сообщает пользователю "Точная фраза "такая-то" не найдена, "такая-то...фраза", скорее всего, — литературный штамп или другой вид устойчивого сочетания слов" и записывает обе фразы в промежуточную базу данных для дальнейшей обработки и помещения в список. Эта часть программы позволяет находить литературные штампы в случаях, когда штамп включает дополнения или во фразе используется обратный порядок слов, например "глаза лучистые" или "лучистые зеленые глаза".

Если фраза не найдена в списке и поиск по сайтам точной или измененной фразы не вернул результатов, система сообщает пользователю "Фраза "такая-то" — пока что вроде не штамп.

Конечно же система может выдавать ошибочные или противоречивые результаты, поскольку никакие алгоритмы пока что не могут иметь литературного вкуса и чутья, поэтому формулировки ответов — намеренно не совсем однозначные, "...скорее всего ..." и "...пока что вроде...", поскольку и система может ошибиться и какие-то образные выражения, если их начнут часто использовать, могут со временем стать штампами. Так что не стоит использовать этот сервис или список по ссылке выше как измерительный прибор или средство для обесценивания чьего-либо творчества, в том числе вашего собственного.