Вольф Кицес (wolf_kitses) wrote,
Вольф Кицес
wolf_kitses

Categories:

Интернет и познание

1. Интернет ускорил забывание результатов и идей, сразу не привлекших внимание.

С появлением Интернета и возможностью электронного доступа к научным журналам перед исследователями открылось значительное информационное богатство буквально "на кончиках пальцев". Как они им распоряжаются? Исследование Джеймса Эванса из Чикагского университета даёт парадоксальных ответ - хуже, чем распоряжались раньше. Исследователи цитируют (при прочих равных) в среднем меньше статей, выше вероятность, что статью, приводимую в списке литературы конкретного исследования, также цитируют многие. Поскольку каждое исследование должно приносить какой-то новый результат, списки литературы разных исследований в одной специальности не могут быть "на одно лицо", они должны быть не менее оригинальными чем сами исследования - а они становятся всё более и более однотипными, возникает своего рода "стайный эффект" в цитировании.

 

Наконец (что, по-моему мнению, хуже всего), Интернет ускорил забывание статей, сразу не привлекших к себе внимание. По мере развития электронного доступа списки литературы и в оригинальных исследованиях, и в обзорах всё больше включают "последних" работ и всё меньше "старых". При уменьшении среднего числа цитирований на статью это может затруднить генерирование новых идей и теорий, поскольку наука живёт не собственным гением - или результатами - отдельных учёных, а активностью коллег, корректирующих их идеи и результаты своими, отчего возникает совместное движение к истине. Если же у сообщества появляется "короткая память" (а исследование Эванса демонстрирует "укорачивание" более чем внятно), вместо движения вперёд есть риск топтаться на месте.

В разных науках этот эффект «забывания не заинтересовавшего сразу» проявляется в разной степени. Студенты и исследователи в области life science в среднем цитируют меньше работ, исследователи в области social science и студенты - гуманитарии особенно склонны цитировать преимущественно последние/ «самые новые» книги,  оба эффекта меньше всего выражены у бизнесменов и юристов.

 

[Вот хороший пример «пробуксовывания», который возникает из-за этих эффектов. Недавно в Science была интересная статья, в которой показано путём компьютерного моделирования, что обычный дизруптивный отбор по признакам, влияющим на просто на приспособленность особей к среде, не способен «разорвать» единую популяцию, в которой есть широкая изменчивость этих признаков, и привести к распадению её на две и дальше к симпатическому видообразованию. Дизруптивный отбор – это отбор в пользу высоких и низких значений таких признаков, и против носителей средних значений, так что ранее единый колокол распределения делится на два, почти не перекрывающихся друг с другом. А вот если дополнить естественный отбор половым по ещё одному признаку, значения которого сами по себе на приспособленность не влияют, но влияют на выбор полового партнёра, дизруптивный отбор доходит до конца, единая популяция делится на две, и возможно симпатическое вилообразование. Там дана и математическая модель явления, русский пересказ А.Маркова см. здесь.

Вообще говоря, этот результат был получен существенно раньше. «В 1955 г. Тудей получил разделение единой популяции дрозофилы при одновременном отборе в (+) и (-) – направлениях по числу стерноплевральных щетинок. Однако ряд попыток других исследователей повторить эти опыты оказались неудачными: дизруптивный отбор вёл лишь к увеличению изменчивости признака, а при продолжительном проведении – к формированию 2-х или большего числа дискретных «морф» и их стабилизации, как у парусника Papilio dardanus стабилизированы миметические морфы. Это же касается и дизруптивного отбора по другим признакам, например, на увеличение или уменьшение массы тела. Чтобы дизруптивный отбор был эффективен, его требовалось дополнить половым (который проводился исследователями «насильственно», т.е. был искусственным: при дизруптивном отборе по массе тела мелких мух принудительно спаривали с мелкими, а крупных с крупными (Huges, 1986)».

А затем ситуация разделение исходной популяции на две почти не смешивающиеся друг с другом формы за счёт дизруптивного отбора, сопряжённого с половым, была найдена и в природе. «Дизруптивный отбор эффективен, если идёт по признакам, ограничивающим свободное скрещивание особей, отличающихся экологическими предпочтениями, т.е. является одновременно и отбором на их изоляцию. Примером … может служить дивергенция по величине цветков у растения Polemonium viscosum. У этоговида часть растений имеет мелкие цветки с неприятным гнилостным запахом, которые опыляются мухами, а часть – крупные цветки с приятным сладким ароматом, опыляемые шмелями (вообще, так что от сладости до гнилости один шаг…). Из семян, полученных в перекрёстном опылении морф, вырастают вполне нормальные растения с промежуточным размером цветков. Однако из-за различия опылителей в природе подобного скрещивания практически не происходит, и дизруптивный отбор по величине цветков продолжается (Galen et al., 1978). Из учебника теории эволюции А.С.Северцова, стр.180. В.К.].

 

Как такое возникает и чем поиск литературы исследователями в  библиотеке отличается от интернетного поиска? Эванс считает, что дело в разделении стадий собственно поиска книг / статей по проблеме и вдумчивого просматривания, с уточнением что же надо взглянуть ещё и т.п. Раньше и то и другое происходило в одном и том же библиотечном зале, и оба этапа достаточно гармонично сочетались друг с другом. Сейчас же исследователи поиск проводят в интернете, а вдумчиво просматривают уже в библиотеке и только из найденного. То есть, по сути, селекция производится скорей техническими возможностями интернет-поиска, нежели умом исследователя, содержательно анализирующим прочитанное, второй имеет дело только с уже сформированной выборкой.

Дальше Эванс пишет, что интернет – поиск обладает существенным «эффектом стайности», поскольку организует данные по дате и значимости –как значимости журнала, так и по частоте поисков по той же теме другими ищущими (помимо тех, о которых говорилось выше). Когда в ответ на ключевые слова гугль выдаёт список найденного, то в самых верхних позициях будет то, что ищешь не только ты, но и другие исследователи, причём с максимальной частотой. Ну и кроме того, уже попав на сайт журнала и просматривая отдельные номера, исследователи склонны сбиваться и следовать той системе гиперссылок, которая есть внутри них (найдя нужную статью автора Х, кликать по его фамилии и смотреть другие его же статьи, или другие статьи того же номера), вместо того, чтобы, найдя искомое, сразу перейти к поиску другой нужной статьи в другом журнале и вообще, следовать собственной схеме поиска, заданной их собственным исследованием, а не «навязанной техникой».  В PubMed рядом с абстрактом выдаются родственные по теме статьи, в журнальной публикации – список литературы со ссылками и список статей, ссылающихся на данную, и это «подталкивает» автора в поиске литературы следовать путям, проложенным другими, в связи с их, другой, темой исследований, а не идти своим собственным путём.

Понятно, что это противоречит главной особенности научного исследования – требованию новизны и запрету на повтор. В идеале предполагается, что каждый учёный исследует свою тему / проблему, и прибавляет хоть какой-то но качественно новый кусочек к общему знанию (как говорил Геннадий Николаевич Симкин, учёный определяется открытиями – что он нашёл/описал/показал, чего мы раньше не знали), а не воспроизводством уже полученных результатов или (в теории) следованиям по проторенной колее уже существующих объяснений, которые просто прилагаются к новым случаям. А тут сама «техника», формирующая список литературы, толкает именно к следованию за другими и в размышлении и в экспериментировании, поскольку парадигмальность науки и критическую роль этих самых куновских «образцов» для новых исследователей никто не отменял.

 

[Другая трудность, заставляющая исследователя просматривать не весь список поиска, а ограничиться немногими верхними страницами также связана с ещё одной спецификой поиска в сети интернет, хорошо описанной bbzhukov в посте  «От жажды умираю над ручьём…». Как на рынке во фруктовом ряду смешаны отличные фрукты и фрукты «с бочком» (и если вторых не слушком много, продавцы мотивированы скорей смешивать те и другие, чем разделять), так в Сети при поиске чего-л., относящегося к области специальных знаний об NN, лента поиска на выдаче будет засорена ссылками, упоминающими NN, но в обыденном смысле, или в переносном значении, или ещё как-то. То есть фигня, не имеющая отношение к цели поиска.

«…Набирает наш Некто в поисковике слово «саранча» - и вываливается ему миллион (без шуток!) ссылок.

Первым делом выясняется, что больше половины из них - имена собственные (названия романов, фильмов, рок-групп и т. д.), цитаты из Библии, толкования снов и прочая не имеющая отношения к делу информация. Ладно, допустим Некто ее отсеет (хотя это придется делать вручную - поисковик, отличающий буквальное значение слова от метафорического, еще не изобрели). Все равно останется море ссылок - в основном новостных (очень интересно узнать, что в таком-то году саранча угрожала Саудовской Аравии, а в таком-то - Челябинской области!). А среди тех, которые повествуют о предмете более-менее подробно, - масса всякой ерунды вроде того, что все личинки саранчи вылупляются одновременно, как по команде. (Причем если у человека нет биологического образования, то отличить ерунду от не-ерунды просто по степени правдоподобности излагаемого он не может - некоторые подробности реальной биологии саранчи еще более фантастичны.) Кое-где вкраплены и намеренные выдумки - например, о боевой трансгенной саранче, натасканной на демаскировку, а при случае и уничтожение противника. И полный апофеоз - фотографии: абсолютное большинство их изображает мирных кузнечиков (в основном семейства Tettigonidae), не имеющих никакого отношения к саранче.

Получается, что свободный доступ к любой информации без возможности ранжирования источников по компетентности блокирует... доступ к собственно информации об интересующем вопросе. Причем поэффективнее цензуры: если просто "закрыть" ту или иную информацию, человек при достаточно высокой мотивации ее все равно найдет. А тут он даже не узнает, что ничего не получил.

Я выбрал саранчу как пример предмета, "о котором все что-то слышали", потому что сам я знаю про нее достаточно, чтобы с двух-трех строк понять статус того или иного ресурса. (Это не значит, что мне нельзя впарить никакую фигню про саранчу, но такую фигню придется стряпать намеренно и прицельно.) Но ведь есть же масса вещей, о которых я знаю не больше, чем среднестатистический интернет-юзер - о саранче. И ведь о них, поди, тоже написана в основном фигня?».

Отсюда

 

Понятно, что в случае научного поиска, скажем, в Гугль Школар или в PubMed эта проблема не снимается, а воспроизводится «на другом витке спирали»: кроме того, что тебе нужно для исследования, система гиперссылок и кроссреференций выдаёт много близкого, но не нужного. Так или иначе, лист поиска оказывается засорён ссылками, не относящимися к конкретной теме и проблеме исследователя, всё просматривать, отделяя овнов от козлищ, психологически трудно, поэтому смотрят в основном первую страницу и верхние строчки списка, выданного поисковиком. – В.К.].

 

Означает ли это конец обзора литературы как самостоятельной части научного исследования? Эванс считает, что нет, если сообщество примет специальные усилия для нейтрализации этих неблагоприятных эффектов [а отдельным исследователям, видимо, надо помнить об этом и не поддаваться].  Хотя одновременно он подчёркивает, что Интернет увеличивает возможность прихода исследователей к консенсусу по поводу наиболее перспективны тем, проблем исследования, или рабочих гипотез «техническим», а не собственно научным путём, а конвенциональная истина может сильно отличаться от истины просто. По словам Эванса, с появлением интернет-доступа к научным изданиям ситуация напоминает    ситуацию с новыми фильмами: если исследование сразу не привлекло внимание и не стало цитироваться, оно имеет очень высокие шансы быть забытым. Но наука не фильм, её задача дать знание, а не произвести впечатление…

Эванс хочет продолжить своё исследование вместе с лингвистами и специалистами в computer science, чтобы исследовать, как стоит излагать свои мысли и результаты в статьях, чтобы нейтрализовать этот неприятный эффект, а также исследовать последствия «потери старых идей» для научного сообщества, как их исправить и т.д.

Источник

 

[Мне кажется, что лучше следовать правилам работы с литературой, изложенным физиологом А.Т.Марьяновичем в книге «Эрратология или как избежать наиболее неприятных ошибок при написании диссертации», с.14-20. Вообще, всем, кто занимается наукой профессионально, или просто интересуется «производством» научного знания, горячо рекомендую прочесть. Структура деятельности исследователя там описана в практическом плане, как говорят в армии, по разделениям, с отделением правильных действий от неправильных, легко и с юмором. То есть в библиотеке читаем литературу, необходимую на данном шаге исследования и формируем список источников, важных для следующего шага, а Интернет используем лишь как «удочку» - В.К.].

 

Правда, коллега возразила мне, что эффект, обнаруженный Эвансом, связан не с особенностями поиска в Интернете, а с «духом времени» - увеличением конкурентности в исследованиях, влиянием публикабельности и цитируемости etc. Но мне кажется, тут такое же различие, как между proximate mechanisms и ultimate mechanisms – первые технически реализуют цели, поставленные вторыми.  

 

2. Роста темпа предъявления визуальной информации.

Из «Эрратологии», с.135-136: «…Еще несколько лет назад в двадцатиминутном докладе считалось приличным показать 8-10 слайдов [я ещё помню, как в мои студенческие годы говорили – 7 таблиц это много, В.К.]. Сейчас такое использование диапроектора напоминает применение артиллерии в эпоху до Наполеона (по пушке на батальон). Мой личный опыт показывает, что демонстрация 70-ти хорошо отработанных слайдов за 30 мин не вызывает неудовольствия слушателей. Аудитория готова, дело за вами. Готовьте к защите (16-18 мин) примерно 35 слайдов. Если они будут сделаны правильно, ощущения спешки не возникнет.

Дисней говорил, что смысл его  фильмов может понять даже человек, пробежавший сквозь зрительный зал. Наша эпоха потребовала большего. На пороге научных учреждений уже стоит поколение, воспитанное на видеоклипах. Как вы думаете, какова экспозиция одного кадра в клипе? — Как правило, менее 1 с, очень редко 2 с и почти никогда 3 с!».

Понятно, что подобное ускорение темпов предъявления научной информации снижает способность зрителей/слушателей доклада разумно проанализировать каждый рисунок (тезис доклада, проиллюстрированный данным рисунком) и либо усомниться в нём, либо согласиться с ним, особенно если они не являются узкими специалистами по той же теме. Приходится или сразу с доверием отнестись ко всему исследованию, или сразу усомниться в нём, как мы это делаем с фильмами или с рекламой. Понятны следующие из этого минусы, поскольку доверием или недоверие тут возникает до и вместо рационального анализа собственно исследования.

 

Tags: книги, наука, современный мир, социология
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 35 comments