nabbla (nabbla1) wrote,
nabbla
nabbla1

Categories:

Как убрать "медузу" и прочий мусор из поисковой выдачи

Чего-то вдруг голландская компания yandex N.V стала настойчиво запихивать мне в глотку "медузу" по поводу и без. Ладно, ещё могу понять, когда я искал весёлую картиночку "Один МиГ - и вы в Белоруссии" и первые две ссылки вели на эту горгону и на эхо. Причём в этот момент я попросил яндекс больше не показывать эти сайты, но разумеется никакого эффекта моя просьба не возымела.

А вчера я просто искал, что же это ЖЖ у меня не работает, не грузится и всё тут, написал что-то вроде "ЖЖ лежит" - и мне первой ссылкой статья на эту "медузу" про артемия лебедева, который с ЖЖ торжественно уходит. А почему ЖЖ висит, так и не понял, но к вечеру вроде зафурычил, и даже козёл Фрэнк среди ночи проснулся.

И я решил посмотреть, а можно ли как-то запретить поисковикам выдавать странички с тех сайтов, что мне не нравятся? Даже хрен с ней, с медузой, а есть просто довольно популярные сайты, которые почти всегда на верхних местах в поиске, но при переходе на которые по конкретной ссылке они может что-то и покажут, но тут же на весь экран будут предлагать зарегистрироваться, при том что какой-то особо ценной информации, стоящей того, там всё равно нет. Так себя ведёт твиттер, реддит, пинтерест кажется, там целый выводок.

Пока результат такой: яндекс подобную фичу не поддерживает, а вот в гугле и DuckDuckGo можно этот процесс "автоматизировать", то бишь один раз вписать нелюбимые сайты - и искать без них :)


Идея очень простая: к строке поиска добавляем
-site:meduza.io


знак "-" как раз и говорит об исключении сайта, без него всё наоборот, только на этом сайте и будет искать. Вот яндекс этот "-" не поддерживает нифига.

И вуаля:


Это просто праздник какой-то :)

В случае гугла для автоматизации процесса достаточно чистого HTML. Создаю новый файл что-нибудь наподобие newpage.htm, и пишу в нём следующее:

<html>
<head>
<title>Поиск без мусора :)</title>
</head>
<body>
<form action="https://google.com/search" method="get">
<input type="text" name="q">
<input type="hidden" name="q" value="-site:meduza.io">
<input type="submit" value="Поиск">
</form>

</body>
</html>


Выглядит оно как-то так:
dead_meduza.png

Поисковый запрос формируется не самый корректный:
https://www.google.com/search?q=meduza+go+to+hell&q=-site%3Ameduza.io#spf=1622675946591


Здесь параметр "q" задаётся дважды, что не совсем по стандарту, и сервер в общем-то имеет право реагировать "как сочтёт нужным". Конкретно гугловский поисковик соединяет все значения q в одну строку, ровно это нам и надо:


Если хотим несколько сайтов "нейтрализовать", можно прямо несколько полей hidden ввести, по одному на каждый. А можно одной строкой, вроде такого:

<html>
<head>
<title>Поиск без мусора :)</title>
</head>
<body>
<form action="https://google.com/search" method="get">
<input type="text" name="q">
<input type="hidden" name="q" value="-site:meduza.io -site:reddit.com">
<input type="submit" value="Поиск">
</form>

</body>
</html>


Опытным путём установлено, что между сайтами надо ставить пробелы, иначе он не сможет их друг от друга отделить.

Но мне для поиска больше нравится DuckDuckGo, там поиск по картинкам сделан нормально, с возможностью найденную картинку тут же сохранить. В гугле чего-то намудрили, там должно перенаправлять на страницу, откуда эта картинка взята, но почему-то чаще всего мне нифига не показывает, тоже какую-нибудь регистрацию просит, или просто страницы уже не существует, кто их поймёт...

Но DuckDuckGo в такой строке с несколькими полями "q" берёт только последнюю, поэтому придётся прибегнуть к javascript:

<html>
<head>
<title>Поиск без мусора :)</title>

<script type="text/javascript">
function AppendBlackList() {
	var ourSearchString = document.getElementById("SearchString");
	ourSearchString.value += " -site:meduza.io -site:reddit.com";
	return true;
}
</script>
</head>
<body>
<form action="https://duckduckgo.com" method="get" onsubmit="AppendBlackList()">
<input type="text" name="q" id="SearchString">
<input type="submit" value="Поиск">
</form>

</body>
</html>


Вроде бы понятно, что он делает: при нажатии на Enter или на кнопочку "Поиск" вызывается функция и прибавляет к только что введённой строке ещё кусочек, а потом уже данные отправляются на сервер.

А ну-ка:


И что из этого получается:


Работает!

Можно ещё css туда прикрутить, чтобы текстовое поле появлялось ровно в центре, это не умею пока. Точнее, когда-то в детстве умел, но уже начисто забыл.

Ну всё, остаётся эту страничку поставить стартовой при открытии новой вкладки - и можно жить :) Хотя, что самое удивительное, для этого ещё надо небольшое расширение установить. В случае Chrome, первое что мне предложили - "change new tab". Как только его устанавливаешь, он просит ввести сайт, я кидаю ссылку на эту страничку, в моём случае file:///C:/work/newDuckDuckGoTab.htm - и вуаля, именно она открывается при запуске новой вкладки.


Не удивлюсь, если есть способ ГОРАЗДО ПРОЩЕ, просто не знаю, по каким словам его искать.
Tags: бред, жулики, странные девайсы
Subscribe

Recent Posts from This Journal

  • Тестируем atan1 на QuatCore

    Пора уже перебираться на "железо" потихоньку. Решил начать с самого первого алгоритма, поскольку он уже был написан на ассемблере. В программу внёс…

  • Формулы приведения, что б их... (и atan на ТРЁХ умножениях)

    Формулу арктангенса на 4 умножениях ещё немножко оптимизировал с помощью алгоритма Ремеза: Ошибка уменьшилась с 4,9 до 4,65 угловой секунды, и…

  • Алгоритм Ремеза в экселе

    Вот и до него руки дошли, причина станет ясна в следующем посте. Изучать чужие библиотеки было лениво (в том же BOOSTе сам чёрт ногу сломит), писать…

  • atan на ЧЕТЫРЁХ умножениях

    Мишка такой человек — ему обязательно надо, чтоб от всего была польза. Когда у него бывают лишние деньги, он идёт в магазин и покупает какую-нибудь…

  • Ай да Пафнутий Львович!

    Решил ещё немного поковыряться со своим арктангенсом. Хотел применить алгоритм Ремеза, но начал с узлов Чебышёва. И для начала со своего "линейного…

  • atan(y/x) на двух умножениях!

    Чего-то никак меня не отпустит эта тема, всё кажется, что есть очень простой и эффективный метод, надо только его найти! Сейчас вот такое…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 3 comments