?

Log in

No account? Create an account
entries friends calendar profile Чулан и склад Вольфа Кицеса Previous Previous Next Next
Интернет и познание - Вольф Кицес
wolf_kitses
wolf_kitses
Интернет и познание

1. Интернет ускорил забывание результатов и идей, сразу не привлекших внимание.

С появлением Интернета и возможностью электронного доступа к научным журналам перед исследователями открылось значительное информационное богатство буквально "на кончиках пальцев". Как они им распоряжаются? Исследование Джеймса Эванса из Чикагского университета даёт парадоксальных ответ - хуже, чем распоряжались раньше. Исследователи цитируют (при прочих равных) в среднем меньше статей, выше вероятность, что статью, приводимую в списке литературы конкретного исследования, также цитируют многие. Поскольку каждое исследование должно приносить какой-то новый результат, списки литературы разных исследований в одной специальности не могут быть "на одно лицо", они должны быть не менее оригинальными чем сами исследования - а они становятся всё более и более однотипными, возникает своего рода "стайный эффект" в цитировании.

 

Наконец (что, по-моему мнению, хуже всего), Интернет ускорил забывание статей, сразу не привлекших к себе внимание. По мере развития электронного доступа списки литературы и в оригинальных исследованиях, и в обзорах всё больше включают "последних" работ и всё меньше "старых". При уменьшении среднего числа цитирований на статью это может затруднить генерирование новых идей и теорий, поскольку наука живёт не собственным гением - или результатами - отдельных учёных, а активностью коллег, корректирующих их идеи и результаты своими, отчего возникает совместное движение к истине. Если же у сообщества появляется "короткая память" (а исследование Эванса демонстрирует "укорачивание" более чем внятно), вместо движения вперёд есть риск топтаться на месте.

В разных науках этот эффект «забывания не заинтересовавшего сразу» проявляется в разной степени. Студенты и исследователи в области life science в среднем цитируют меньше работ, исследователи в области social science и студенты - гуманитарии особенно склонны цитировать преимущественно последние/ «самые новые» книги,  оба эффекта меньше всего выражены у бизнесменов и юристов.

 

[Вот хороший пример «пробуксовывания», который возникает из-за этих эффектов. Недавно в Science была интересная статья, в которой показано путём компьютерного моделирования, что обычный дизруптивный отбор по признакам, влияющим на просто на приспособленность особей к среде, не способен «разорвать» единую популяцию, в которой есть широкая изменчивость этих признаков, и привести к распадению её на две и дальше к симпатическому видообразованию. Дизруптивный отбор – это отбор в пользу высоких и низких значений таких признаков, и против носителей средних значений, так что ранее единый колокол распределения делится на два, почти не перекрывающихся друг с другом. А вот если дополнить естественный отбор половым по ещё одному признаку, значения которого сами по себе на приспособленность не влияют, но влияют на выбор полового партнёра, дизруптивный отбор доходит до конца, единая популяция делится на две, и возможно симпатическое вилообразование. Там дана и математическая модель явления, русский пересказ А.Маркова см. здесь.

Вообще говоря, этот результат был получен существенно раньше. «В 1955 г. Тудей получил разделение единой популяции дрозофилы при одновременном отборе в (+) и (-) – направлениях по числу стерноплевральных щетинок. Однако ряд попыток других исследователей повторить эти опыты оказались неудачными: дизруптивный отбор вёл лишь к увеличению изменчивости признака, а при продолжительном проведении – к формированию 2-х или большего числа дискретных «морф» и их стабилизации, как у парусника Papilio dardanus стабилизированы миметические морфы. Это же касается и дизруптивного отбора по другим признакам, например, на увеличение или уменьшение массы тела. Чтобы дизруптивный отбор был эффективен, его требовалось дополнить половым (который проводился исследователями «насильственно», т.е. был искусственным: при дизруптивном отборе по массе тела мелких мух принудительно спаривали с мелкими, а крупных с крупными (Huges, 1986)».

А затем ситуация разделение исходной популяции на две почти не смешивающиеся друг с другом формы за счёт дизруптивного отбора, сопряжённого с половым, была найдена и в природе. «Дизруптивный отбор эффективен, если идёт по признакам, ограничивающим свободное скрещивание особей, отличающихся экологическими предпочтениями, т.е. является одновременно и отбором на их изоляцию. Примером … может служить дивергенция по величине цветков у растения Polemonium viscosum. У этоговида часть растений имеет мелкие цветки с неприятным гнилостным запахом, которые опыляются мухами, а часть – крупные цветки с приятным сладким ароматом, опыляемые шмелями (вообще, так что от сладости до гнилости один шаг…). Из семян, полученных в перекрёстном опылении морф, вырастают вполне нормальные растения с промежуточным размером цветков. Однако из-за различия опылителей в природе подобного скрещивания практически не происходит, и дизруптивный отбор по величине цветков продолжается (Galen et al., 1978). Из учебника теории эволюции А.С.Северцова, стр.180. В.К.].

 

Как такое возникает и чем поиск литературы исследователями в  библиотеке отличается от интернетного поиска? Эванс считает, что дело в разделении стадий собственно поиска книг / статей по проблеме и вдумчивого просматривания, с уточнением что же надо взглянуть ещё и т.п. Раньше и то и другое происходило в одном и том же библиотечном зале, и оба этапа достаточно гармонично сочетались друг с другом. Сейчас же исследователи поиск проводят в интернете, а вдумчиво просматривают уже в библиотеке и только из найденного. То есть, по сути, селекция производится скорей техническими возможностями интернет-поиска, нежели умом исследователя, содержательно анализирующим прочитанное, второй имеет дело только с уже сформированной выборкой.

Дальше Эванс пишет, что интернет – поиск обладает существенным «эффектом стайности», поскольку организует данные по дате и значимости –как значимости журнала, так и по частоте поисков по той же теме другими ищущими (помимо тех, о которых говорилось выше). Когда в ответ на ключевые слова гугль выдаёт список найденного, то в самых верхних позициях будет то, что ищешь не только ты, но и другие исследователи, причём с максимальной частотой. Ну и кроме того, уже попав на сайт журнала и просматривая отдельные номера, исследователи склонны сбиваться и следовать той системе гиперссылок, которая есть внутри них (найдя нужную статью автора Х, кликать по его фамилии и смотреть другие его же статьи, или другие статьи того же номера), вместо того, чтобы, найдя искомое, сразу перейти к поиску другой нужной статьи в другом журнале и вообще, следовать собственной схеме поиска, заданной их собственным исследованием, а не «навязанной техникой».  В PubMed рядом с абстрактом выдаются родственные по теме статьи, в журнальной публикации – список литературы со ссылками и список статей, ссылающихся на данную, и это «подталкивает» автора в поиске литературы следовать путям, проложенным другими, в связи с их, другой, темой исследований, а не идти своим собственным путём.

Понятно, что это противоречит главной особенности научного исследования – требованию новизны и запрету на повтор. В идеале предполагается, что каждый учёный исследует свою тему / проблему, и прибавляет хоть какой-то но качественно новый кусочек к общему знанию (как говорил Геннадий Николаевич Симкин, учёный определяется открытиями – что он нашёл/описал/показал, чего мы раньше не знали), а не воспроизводством уже полученных результатов или (в теории) следованиям по проторенной колее уже существующих объяснений, которые просто прилагаются к новым случаям. А тут сама «техника», формирующая список литературы, толкает именно к следованию за другими и в размышлении и в экспериментировании, поскольку парадигмальность науки и критическую роль этих самых куновских «образцов» для новых исследователей никто не отменял.

 

[Другая трудность, заставляющая исследователя просматривать не весь список поиска, а ограничиться немногими верхними страницами также связана с ещё одной спецификой поиска в сети интернет, хорошо описанной bbzhukov в посте  «От жажды умираю над ручьём…». Как на рынке во фруктовом ряду смешаны отличные фрукты и фрукты «с бочком» (и если вторых не слушком много, продавцы мотивированы скорей смешивать те и другие, чем разделять), так в Сети при поиске чего-л., относящегося к области специальных знаний об NN, лента поиска на выдаче будет засорена ссылками, упоминающими NN, но в обыденном смысле, или в переносном значении, или ещё как-то. То есть фигня, не имеющая отношение к цели поиска.

«…Набирает наш Некто в поисковике слово «саранча» - и вываливается ему миллион (без шуток!) ссылок.

Первым делом выясняется, что больше половины из них - имена собственные (названия романов, фильмов, рок-групп и т. д.), цитаты из Библии, толкования снов и прочая не имеющая отношения к делу информация. Ладно, допустим Некто ее отсеет (хотя это придется делать вручную - поисковик, отличающий буквальное значение слова от метафорического, еще не изобрели). Все равно останется море ссылок - в основном новостных (очень интересно узнать, что в таком-то году саранча угрожала Саудовской Аравии, а в таком-то - Челябинской области!). А среди тех, которые повествуют о предмете более-менее подробно, - масса всякой ерунды вроде того, что все личинки саранчи вылупляются одновременно, как по команде. (Причем если у человека нет биологического образования, то отличить ерунду от не-ерунды просто по степени правдоподобности излагаемого он не может - некоторые подробности реальной биологии саранчи еще более фантастичны.) Кое-где вкраплены и намеренные выдумки - например, о боевой трансгенной саранче, натасканной на демаскировку, а при случае и уничтожение противника. И полный апофеоз - фотографии: абсолютное большинство их изображает мирных кузнечиков (в основном семейства Tettigonidae), не имеющих никакого отношения к саранче.

Получается, что свободный доступ к любой информации без возможности ранжирования источников по компетентности блокирует... доступ к собственно информации об интересующем вопросе. Причем поэффективнее цензуры: если просто "закрыть" ту или иную информацию, человек при достаточно высокой мотивации ее все равно найдет. А тут он даже не узнает, что ничего не получил.

Я выбрал саранчу как пример предмета, "о котором все что-то слышали", потому что сам я знаю про нее достаточно, чтобы с двух-трех строк понять статус того или иного ресурса. (Это не значит, что мне нельзя впарить никакую фигню про саранчу, но такую фигню придется стряпать намеренно и прицельно.) Но ведь есть же масса вещей, о которых я знаю не больше, чем среднестатистический интернет-юзер - о саранче. И ведь о них, поди, тоже написана в основном фигня?».

Отсюда

 

Понятно, что в случае научного поиска, скажем, в Гугль Школар или в PubMed эта проблема не снимается, а воспроизводится «на другом витке спирали»: кроме того, что тебе нужно для исследования, система гиперссылок и кроссреференций выдаёт много близкого, но не нужного. Так или иначе, лист поиска оказывается засорён ссылками, не относящимися к конкретной теме и проблеме исследователя, всё просматривать, отделяя овнов от козлищ, психологически трудно, поэтому смотрят в основном первую страницу и верхние строчки списка, выданного поисковиком. – В.К.].

 

Означает ли это конец обзора литературы как самостоятельной части научного исследования? Эванс считает, что нет, если сообщество примет специальные усилия для нейтрализации этих неблагоприятных эффектов [а отдельным исследователям, видимо, надо помнить об этом и не поддаваться].  Хотя одновременно он подчёркивает, что Интернет увеличивает возможность прихода исследователей к консенсусу по поводу наиболее перспективны тем, проблем исследования, или рабочих гипотез «техническим», а не собственно научным путём, а конвенциональная истина может сильно отличаться от истины просто. По словам Эванса, с появлением интернет-доступа к научным изданиям ситуация напоминает    ситуацию с новыми фильмами: если исследование сразу не привлекло внимание и не стало цитироваться, оно имеет очень высокие шансы быть забытым. Но наука не фильм, её задача дать знание, а не произвести впечатление…

Эванс хочет продолжить своё исследование вместе с лингвистами и специалистами в computer science, чтобы исследовать, как стоит излагать свои мысли и результаты в статьях, чтобы нейтрализовать этот неприятный эффект, а также исследовать последствия «потери старых идей» для научного сообщества, как их исправить и т.д.

Источник

 

[Мне кажется, что лучше следовать правилам работы с литературой, изложенным физиологом А.Т.Марьяновичем в книге «Эрратология или как избежать наиболее неприятных ошибок при написании диссертации», с.14-20. Вообще, всем, кто занимается наукой профессионально, или просто интересуется «производством» научного знания, горячо рекомендую прочесть. Структура деятельности исследователя там описана в практическом плане, как говорят в армии, по разделениям, с отделением правильных действий от неправильных, легко и с юмором. То есть в библиотеке читаем литературу, необходимую на данном шаге исследования и формируем список источников, важных для следующего шага, а Интернет используем лишь как «удочку» - В.К.].

 

Правда, коллега возразила мне, что эффект, обнаруженный Эвансом, связан не с особенностями поиска в Интернете, а с «духом времени» - увеличением конкурентности в исследованиях, влиянием публикабельности и цитируемости etc. Но мне кажется, тут такое же различие, как между proximate mechanisms и ultimate mechanisms – первые технически реализуют цели, поставленные вторыми.  

 

2. Роста темпа предъявления визуальной информации.

Из «Эрратологии», с.135-136: «…Еще несколько лет назад в двадцатиминутном докладе считалось приличным показать 8-10 слайдов [я ещё помню, как в мои студенческие годы говорили – 7 таблиц это много, В.К.]. Сейчас такое использование диапроектора напоминает применение артиллерии в эпоху до Наполеона (по пушке на батальон). Мой личный опыт показывает, что демонстрация 70-ти хорошо отработанных слайдов за 30 мин не вызывает неудовольствия слушателей. Аудитория готова, дело за вами. Готовьте к защите (16-18 мин) примерно 35 слайдов. Если они будут сделаны правильно, ощущения спешки не возникнет.

Дисней говорил, что смысл его  фильмов может понять даже человек, пробежавший сквозь зрительный зал. Наша эпоха потребовала большего. На пороге научных учреждений уже стоит поколение, воспитанное на видеоклипах. Как вы думаете, какова экспозиция одного кадра в клипе? — Как правило, менее 1 с, очень редко 2 с и почти никогда 3 с!».

Понятно, что подобное ускорение темпов предъявления научной информации снижает способность зрителей/слушателей доклада разумно проанализировать каждый рисунок (тезис доклада, проиллюстрированный данным рисунком) и либо усомниться в нём, либо согласиться с ним, особенно если они не являются узкими специалистами по той же теме. Приходится или сразу с доверием отнестись ко всему исследованию, или сразу усомниться в нём, как мы это делаем с фильмами или с рекламой. Понятны следующие из этого минусы, поскольку доверием или недоверие тут возникает до и вместо рационального анализа собственно исследования.

 

Tags: , , ,

35 comments or Leave a comment
Comments
bacchusv From: bacchusv Date: March 14th, 2010 12:50 am (UTC) (Link)
Очень сомнительные причинно-следственные связи проведены, особенно относительно забывания. Практически любое исследование начинается с ознакомления с каноническими трудами по теме -- теми, которые широко известны. Современные же статьи, которые гораздо менее известны, включить в своё чтение значительно сложнее. С онлайновым поиском же, я могу, прочитав старую статью, увидеть кто её цитировал, прочитать работы этих людей, и, в случаях когда они двигают понравившуюся мне тему вперёд, ссылаться уже на них, а не на старый источник. Учитывая, насколько онлайновый поиск облегчает поиск новых работ, которые ещё не успели получить репутации, мы и должны ожидать, что цитирование недавнего будет расти.

А ваш пример с забытым выводом -- это не артефакт онлайнового века, такие вещи всегда происходили, чтобы какое-то исследование вошло в мейнстрим, оно должно быть широко распространено, у него должна установиться самоподдерживающаяся репутация. Очень часто этого не происходит. В психологии развития, например, западные авторы неожиданно обнаружили для себя Выготского и Лурия -- кстати обнаружили в том числе именно из-за Интернета, без которого западным исследователям было бы очень трудно повстречать советские работы.
wolf_kitses From: wolf_kitses Date: March 14th, 2010 01:08 am (UTC) (Link)
западные авторы неожиданно обнаружили для себя Выготского и Лурия //
Не из-за Интернета, а из-за перевода в 1962-м г. "Мышления и речи" на английский язык, имевшего большой успех
http://scepsis.ru/library/id_853.html#a1
в 1978 г. перевели уже всего Выгодского, в 70-х гг. Лурия работал вместе с американцами (скажем, с А.Маршаком), американские исследователи психологии культуры Коул и Скрибнер были учениками Лурии ещё при его жизни и т.д. Причём здесь интернет?
И насколько я понимаю, Ваши соображения из первого абзаца - это Ваше мнение, Вам так кажется? Есть ли у Вас какие-либо социологические данные в пользу того, что так и есть на самом деле? Я спрашиваю потому, что Эванс более чем убедителен, а Вы так его сразу отвергаете с порога...
evgeniy_kond From: evgeniy_kond Date: March 14th, 2010 06:32 am (UTC) (Link)
В Яндексе теперь первая ссылка обычно на статью в Вики, т.ч. описанная (причем дилетантски) проблема с нерелевантностью поиска - техническая.
avs_lt From: avs_lt Date: March 14th, 2010 07:04 am (UTC) (Link)
Мне кажется, что технологии информационного поиска, доступные с появлением интернета - это не более, чем очередной виток спирали. И наука скоро адаптируется к ним своим традиционным способом: популярность (в т. ч. - индекс цитирования) будет зависеть от ключевого, на мой взгляд, фактора - активности и информационно-социальной адаптированности последователей (а не самих авторов открытий и первичных исследований). Т.е. известность и цитируемость работ ученого А. будет зависеть оттого, насколько хорошо сумеет "раскрутить" в виртуальом пространстве ученый Б., у которого работы А. занимают первые позиции в списке литературных источников. При этом мало зависит оттого, насколько популярными были работы А. до появления Б. (и вообще, более глобально - какой временной период отделяет А. и Б.). Классический пример А. и Б. - Христос и апосол Павел. А в науке подобных примеров в доинтернетовскую эпоху Вы легко найдете сотни.
Все равно все топы поисковиков накручивает далекая от науки человеческая масса - толпа, которую кроме шоппинга и секса, по большому счету, ничего не интересует. Однако интернет теперь дает ученым Б. неограниченные возможности - вывести в топы какие-то интересные работы можно очень быстро, независимо оттого, сколько десятилетий они пролежали на полках библиотек. Для одних (интформационных потребителей) интернет - это исключительно способ поиска, для других (информационных производителей) - это способ презентации. Ясно, что наши Б. будут относиться ко второй группе, и свои источники искать за пределами интернета.
werekat From: werekat Date: March 14th, 2010 07:42 am (UTC) (Link)
Слушайте, спасибо Вам огромное за "Эрратологию"!
Меня она просто спасает. Будучи гуманитарием, я не знакома на профессиональном уровне со статистической обработкой данных, правилами постановки естественнонаучных экспериментов, и иже с ним. А область моих исследований такова, что без знания этих методов в ней совершенно невозможно разобраться. Информацию я собирала по кускам и самостоятельно, но чтобы вот так, в одном месте, человеческим языком и с толком - это же просто подарок!
Жаль, что раньше не попалась, но хорошо, что сейчас, а не тремя годами позднее.
Ещё раз спасибо огромное.
wolf_kitses From: wolf_kitses Date: March 15th, 2010 02:20 pm (UTC) (Link)
Рад, что пригодилось-:)))
mevuelvoguajiro From: mevuelvoguajiro Date: March 14th, 2010 08:10 am (UTC) (Link)
справедливости ради - экспозиция одного кадра не может быть больше 1/24 с )
видимо имеется в виду длина одного плана. тогда все в общем так и есть. но самое удивительное, для меня, регулярно снимающего тридцатисекундные ролики (а и 15 ведь бывает делаем), что это кто-то способен воспринимать.
timur0 From: timur0 Date: March 14th, 2010 09:22 pm (UTC) (Link)
справедливости ради - в кино "кадром" также называется кусок между двумя монтажными склейками, т.е. то, что вы назвали планом
ivanov_petrov From: ivanov_petrov Date: March 14th, 2010 09:23 am (UTC) (Link)
да, интересно. Мне бы казалось, это более общее, чем только техника поиска в стеи, и менее - чем "дух времени". Это просто общий симптом массовой деятельности. наука стала массовой - и поиск стал массовым, и написание статей, и доклады, и обработка научной инфы. Массовизация деятельности приводит к такому вот... созданию мод и затрудненному доступу к редкостям. С положительными и отрицательными последствиями - на что приятнее обращать внимание.
050778 From: 050778 Date: March 14th, 2010 10:45 pm (UTC) (Link)
+1, очень разумное замечание
sparrow_grass From: sparrow_grass Date: March 14th, 2010 09:55 am (UTC) (Link)
Все верно, я тоже уже думала над этим. Вообще, при анализе литературы бросается в глаза резкое качественное отличие статей, написанных, скажем, в 1980-1990-е и 2000-е. Границей раздела примерно служит 1996-ой год, начиная с которого, как правило, статьи стали повально появляться в электронном виде.
beobaxter From: beobaxter Date: March 14th, 2010 12:17 pm (UTC) (Link)
Спасет ли ситуацию поисковим со случайной, нерелевантной выдачей? В принципе, у Гугля уже есть кнопка "Мне повезет", надо лишь дисциплинировать себя, заставить ею пользоваться...
wolf_kitses From: wolf_kitses Date: March 15th, 2010 02:15 pm (UTC) (Link)
очень трудно заставить себя не идти по crossrefention в Pubmed или на сайте журнала, а следовать своей собственной схеме поиска
shurikbarne From: shurikbarne Date: March 15th, 2010 04:37 pm (UTC) (Link)
Дауш, чего нет в сайенсдиректе - того не существует о(.
anti0h From: anti0h Date: March 16th, 2010 07:49 am (UTC) (Link)
Просто вот почти вижу, как какой-нибудь монах-францисканец, веке этак в ..надцатом, жалуется своим собратьям, как распространение книгопечатания губит благочестие и истинную веру:
- Вот раньше книги доступны были только в монастырских скрипториях, где святая братия берегла их, как зеницу ока. Книг мало было, потому читать можно было что угодно. Всё равно в скрипторий попадали только богоугодные тексты.
А теперь это богомерзкое книгопечатание позволяет любому бюргеру писать что вздумается. Разврат и упадок нравов. Говорят, недавно один саксонец перевёл, страшно подумать, Библию, но свой мерзкий язык. Кошмар! Точно говорю вам, братия, близятся последние времена!! (:
wsf1917 From: wsf1917 Date: March 16th, 2010 03:09 pm (UTC) (Link)
Как бы попробовать объективно проверить ваше вИдение? (визионеры обычно расходятся с реальностью)
From: (Anonymous) Date: February 6th, 2011 11:28 pm (UTC) (Link)

SirRoma

Российская федерация

Боулинг
35 comments or Leave a comment