ИнфоРост
информационные технологии для архивов и библиотек
Главная О проекте

 


 

ОПИСАНИЕ ПРОЕКТА

Обновления - 2020 г.: См. презентацию "Научно-издательский проект “Электронная коллекция Летописей Российской книжной палаты за 100 лет (1917-2017 гг.)” на научно-практической онлайн-конференции «I Грибановские чтения», посвященной 140-летию со дня рождения выдающегося библиографа Сибири Н.Н. Грибановского (18.09.1880 – 17.01.1942), 95-летию организации Национальной библиотеки Республики Саха (Якутия) и 20-летию Арктического государственного института культуры и искусств. Конференция состоялась 10-11 декабря 2020 года в Национальной библиотеке Республики Саха (Якутия),  г. Якутск.)

*     *     *

Начало проекта - 2017 г. Российская книжная палата (РКП), национальный депозитарий печатных изданий и издатель Книжной летописи, отметила в 2017 году 100-летний юбилей своей деятельности. Переоценить значение вековой роли РКП и Летописей для нужд науки, государственной и общественной жизни - невозможно.

В качестве библиографического указателя для всех изданий по всем отраслям знаний и практической деятельности, выходящих в России из под печатного станка, Книжная летопись отражает не только интеллектуальный потенциал, но и “духовные силы нашей Родины”, как отметил в 1917 году первый директор РКП С.А. Венгеров. В обращении к гражданам на заре рождения Российской книжной палаты ее первый директор призывал:

“Мы должны сохранить результаты великого подъема нашего исключительного времени для времен будущих. И современный публицист, и государственный деятель, и будущий историк должны иметь возможность на основании небывало разнообразного печатного материала наших дней составить себе исчерпывающее представление о всех надеждах, чаяниях и настроениях современной русской жизни... Давно уже назрела насущная потребность подвести итоги и произвести учет результатам русского литературного, научного и политического движения, зарегистрировать и систематизировать десятки тысяч появляющихся ежегодно книг и многие сотни тысяч статей, печатающихся в периодических изданиях”.

В течение 100 лет издания по сегодняшний день, Летописи продолжают служить главным библиографическим указателем для тысяч библиотек, научно-образовательных, исследовательских и государственных учреждений в России и за ее пределами. На основе Летописей осуществляется справочная работа библиотек и информационных отделов различных учреждений, составляются научно-вспомогательные и рекомендательные библиографические указатели по всем отраслям знаний и практической деятельности, изучается история российского книгопечатания.

Вместе с тем, учитывая редкость старых номеров за первые 20-30 лет издания Летописей и ветхость печатных изданий, часто использовавшихся для справочной работы, подавляющее большинство библиотек имеет в своих коллекциях ограниченные комплекты бумажных Летописей с существенными пропусками отдельных номеров. Можно утверждать, что сегодня нет ни одной библиотеки, имеющей в своем наличии полный комплект Летописей с первого до последнего номера, включая дополнительные, специальные и указательные выпуски. Фактически, полный комплект всех номеров Летописей на сегодняшний день отсутствует и требует восстановления.

В свете этих идей и в ознаменование столетия издания Книжной летописи, научно-издательский проект “Полная электронная коллекция Летописей РКП за 1917 - 2017 гг.” призван воссоздать их полный комплект в электронном виде, начиная с первого номера, и сделать его доступным максимально большому количеству библиотек в сети Интернет. 


 

ПОЛНЫЙ КОМПЛЕКТ ЛЕТОПИСЕЙ С 1917 ПО 2017 ГГ.                                                           [наверх]

 

 

Перио-дичность

Первый выпуск

Всего лет публикации

Кол-во номеров в комплекте

Кол-во биб записей в год в среднем*

Всего биб записей*

             

Книжная летопись

52

1917

100

5,200

65,000

6,500,000

Летопись журнальных статей

52

1926

91

4,732

65,000

5,915,000

Летопись газетных статей

52

1936

81

4,212

12,000

972,000

Летопись изоизданий

4

1934

83

332

1,500

124,500

Летопись рецензий

12

1935

82

984

4,000

328,000

Нотная летопись

4

1931

86

344

400

34,400

Картографическая летопись

1

1931

86

86

200

17,200

Летопись периодических и продолжающихся изданий

1

1933

84

84

   

Библиография российской библиографии

1

1941

76

76

   

Летопись авторефератов диссертаций

12

1981

36

432

12,000

432,000

             

Всего

     

16,482

 

14,323,100

             

* приблизительная оценка

           

 

ЦЕЛИ ПРОЕКТА                                                                                                                                                          [наверх]

 

Долгосрочными целями проекта являются следующие:

1. Воссоздание полных комплектов Летописей за все годы издания путем оцифровки и онлайн-публикации имеющихся бумажных номеров Летописей в виде электронных образов, идентификации пропущенных номеров и восполнение ими электронной коллекции.

2. Улучшение доступа исследователей к полной коллекции Летописей путем их распознавания (OCR) для целей полнотекстового поиска.

3. Корректировка ошибок распознавания библиографических записей и их структуризация по полям в формат базы данных, сшивка переносов слов. На основе структурированных записей к полной коллекции Летописей будет добавлена группа Указателей, систематизирующих записи по автору, дате и месту издания, тематике и т.д. Указатели раскроют исследователям содержание коллекции и помогут быстрее находить требуемые библиографические записи.

В результате работы по указанным направлениям полный комплект Летописей будет воссоздан в электронном виде с возможностью чтения номеров на экране компьютера, полнотекстового поиска по библиографическим записям и навигации по ним с помощью системы Указателей.

 

ЭТАПЫ РЕАЛИЗАЦИИ

Говоря о воссоздании полного комплекта Летописей, следует отметить, что в 1979 году Российская книжная палата стала производить и распространять по организациям электронные записи Летописей в дополнение к печатным изданиям. Поэтому на первом этапе проекта предполагается сосредоточиться на тех годах издания Летописей, для которых электронные записи отсутствуют.

Этап 1. Создание базовой коллекции “Полный электронный комплект Книжной летописи за первые 60 лет издания. 1917 - 1978 гг.  3,126 номеров. 2,200,000 биб записей.

На этом этапе полный комплект Книжной летописи с 1917 по 1978 гг. будет воссоздан в электронном виде с доступом в Интернете. Всего в этот период было опубликовано 3,126 номеров, из которых 174 пока отсутствуют в коллекции. В задачи данного этапа входит поиск и оцифровка недостающих номеров и онлайн-публикация полного комплекта с возможностями чтения отдельных номеров на экране и полнотекстового поиска по всей коллекции.

Этап 2. Дополнение базовой коллекции другими Летописями - журнальной, газетной, изоизданий, рецензий и т.д. 1926-1978 гг. 9,017 номеров. 2,500,000 биб записей. Добавление к коллекции Книжных летописей, издававшихся с 1907 по 1916 гг.

2.1. Оцифровка и распознавание имеющихся в Российской книжной палате печатных номеров следующих Летописей с первого года издания по 1978 год:

 

 

Перио-дичность

Первый выпуск

Кол-во номеров по 1978 г.

Кол-во биб записей в год в среднем*

Всего биб записей*

           

Летопись журнальных статей

52

1926

2,704

40,000

2,080,000

Летопись газетных статей

52

1936

2,184

7,000

294,000

Летопись изоизданий

4

1934

176

1,000

44,000

Летопись рецензий

12

1935

516

2,750

118,250

Нотная летопись

4

1931

188

250

11,750

Картографическая летопись

1

1931

47

125

5,875

Летопись периодических и продолжающихся изданий

1

1933

45

   

Библиография российской библиографии

1

1941

37

   
           

Всего

   

9,017

 

2,553,875

           

* приблизительная оценка

         

 

2.2. Поиск и оцифровка/распознавание недостающих номеров.

2.3. Текущее добавление (онлайн-публикация) новых оцифрованных/распознанных номеров Летописей к имеющейся электронной коллекции.

Этап 3. Исправление ошибок распознавания в оцифрованных биб записях. Структуризация записей по полям метаданных.

На этом этапе группа редакторов сверяет распознанные тексты биб записей с их оригиналами в виде образа страницы, исправляет ошибки распознавания и сшивает переносы слов для улучшения результатов полнотекстового поиска. Записи разносятся по отдельным полям метаданных и загружаются в коллекцию в формате базы данных.

На основе структурированных записей к коллекции добавляется система Указателей, позволяющая библиотекарям и исследователям просматривать все библиографические записи по автору, названию, тематике, дате и месту публикации и другим значениям. Также будет возможен полнотекстовой поиск по отдельным полям записей и по их комбинациям, по отдельным Летописям, по отдельным годам издания и т.д.

Этап 4. Добавление к коллекции образов и электронных записей для Летописей, издававшихся с 1979 по 2017 гг.

Работы по перечисленным выше направлениям могут осуществляться последовательно или одновременно в поточном режиме. Объем и скорость оцифровки/добавления в коллекцию новых номеров Летописей будут зависеть от размеров финансирования проекта.

Результатом реализации указанных выше этапов проекта станет создание полной электронной коллекции всех Летописей с первого года издания по 2017 год с возможностью чтения номеров на экране компьютера, навигации по более чем 15 миллионам биб записей с помощью системы Указателей и полнотекстового поиска.

Проект осуществляется Российской книжной палатой (РКП) в партнерстве с Некоммерческим партнерством “ИнфоРост”. Проект открыт для участия всех библиотек и организаций, разделяющих цели его создания и готовых содействовать их реализации.


 

ЧЛЕНСКАЯ ПРОГРАММА УЧАСТИЯ БИБЛИОТЕК                                                                                           [наверх]

 

Предлагаем вашему коллективу присоединиться к проекту. Библиотека-участник получит возможность:

1. Доступа по Интернет к растущей электронной коллекции исторических Летописей РКП. Электронный архив Российской национальной библиографии включает в себя на сегодня 8,620 номеров Книжной летописи (1917-1978 гг.), Летописи журнальных статей (1926-1990 гг.) и Летописи газетных статей (1936-1987 гг.). Новый электронный ресурс совокупно содержит около 11 миллионов библиографических описаний, что является наиболее полным собранием библиографических записей об издательской деятельности в России и Советском Союзе, начиная с 1917 г.

2. Доступа к регулярным обновлениям новыми оцифрованными номерами архивных Летописей.

3. Участия в определении приоритетов контентного и функционального развития Электронного архива Российской национальной библиографии, а также создания на его основе новых информационных продуктов и услуг для исследователей и студентов.


 

Ежегодные членские взносы Участника проекта основываются на следующих категориях организаций:                                                                                                                                                                [наверх]

 

Категория организации

Ежегодный взнос (руб.)

1. Городские, районные и библиотеки ВУЗов (менее 3 тыс. студентов и преподавателей), небольшие узкоспециализированные библиотеки (1-3 сотрудника). Физические лица.

7 500

2. Библиотеки субъектов РФ (областные, краевые, республиканские и т.д.) и средние ВУЗовские библиотеки (от 3 до 10 тыс. студентов и преподавателей).

15 000

3. Центральные федеральные и крупные ВУЗовские библиотеки (более 10 тыс. студентов и преподавателей).

25 000

 

Надеемся, что новая электронная коллекция Летописей окажется вам полезной для исследовательской работы и библиографического обслуживания пользователей. Более чем подписной ресурс для библиотек, мы хотели видеть этот проект как возможность для совместной издательской и исследовательской работы библиографов, библиотекарей и издателей, объединенных профессиональным интересом в области развития российской национальной библиографии. 

Эта работа включает восстановление исторического 100-летнего комплекта всех номеров Летописей в электронном виде. Одновременно мы стремимся сделать доступ к этому важному библиографическому ресурсу доступным для широкого круга библиотек, и совместно вырабатывать с участниками проекта стратегию развития Электронного архива Российской национальной библиографии и новых информационных ресурсов и услуг для пользователей на его основе.

Наша группа объединяет в себе коллег-библиографов, библиотекарей и издателей,  разделяющих уверенность в том, что важность библиографической работы и ресурсов повышается в результате взрывообразного роста количества и используемости информационных источников разного качества на Интернет. Электронно-издательский проект Летописей в этом плане служит долгосрочной цели улучшения доступа к высококачественным источникам информации для студентов и исследователей, и в целом продвижению библиографии как науки и практики.

Данный пилотный электронный архив Летописей является крупнейшей коллекцией исторических записей Российской национальной библиографии с возможностями полнотекстового поиска. Коллекция содержит в себе библиографические записи о работах, которые не обнаруживаются на Интернете и в каталогах крупнейших библиотек России. Выявление “неизвестных” работ является еще одной долгосрочной исследовательской целью проекта электронного архива Летописей.   

 


 

КАК СТАТЬ УЧАСТНИКОМ ПРОЕКТА                                                                                                      [наверх]

 

Мы будем рады вашему участию в проекте. Пожалуйста пишите если есть вопросы. Заявки на участие в проекте, а также на тестирование работы электронного архива можно присылать на имейл адрес info@inforost.org.


ОТЗЫВЫ И ПРЕДЛОЖЕНИЯ ПО РАЗВИТИЮ ПРОЕКТА                                                                      [наверх]

 

  • Тертицкий Константин Маркович, Институт стран Азии и Африки МГУ (зав. кафедрой истории Китая):

Мы на кафедре составляем библиографию публикаций о Китае в российской прессе. Этим летом мы хотели бы привлечь к работе наших студентов в рамках прохождения практики и предложили им составить перечень статей о Китае и сопредельных странах в советской прессе 1936-1941 годов на основе библиографических записей Электронного архива Летописей.

Материалы Летописей посмотрел - очень впечатляюще, когда весь массив будет распознан, это, конечно, сильно изменит жизнь историков, занимающихся ХХ веком! А если библиотеки в регионах туда добавят местные издания - будет совсем замечательно!  Речь идет о библиографии по журнальным и газетным статьям в местной печати, которая не попала в ЛЖС и ЛГС. 

Если говорить об охвате Летописями национальной библиографии статей местной периодической печати, то про весь объем говорить не возьмусь, но по дальневосточной тематике, думаю, охват сначала был не очень большой, потом постепенно рос. Интересно было бы собрать информацию по местным источникам, где, конечно, будет преобладать краеведение, но могут оказаться самые неожиданные вещи. Для востоковедов самое обидное - отсутствие материалов до 1932 года, когда публикация международной информации была централизована. 

И еще два предложения: 

(1) Возможно, в рамках проекта можно было бы использовать библиографические справочники по отдельным странам, если для этого не будет препятствий, связанных с авторским правом. 

(2) У многих с региональных библиотек.есть локальный поиск по их ресурсам, включая периодику. Мне кажется, можно было бы получить большой положительный эффект, если бы удалось создать глобальный поиск с одной точкой введения запроса (т.е. если бы человек в любой этой библиотеке мог ввести режим поиска не только у себя в библиотеке, но и в целом по стране).


 

  • Мария Мизерная, студент Школы Филологии ВШЭ:

Взгляд своими глазами на список реально изданных книг очень дополняет (а в чем-то и опровергает) сложившуюся у меня по научным работам картину литературы при Сталине. По заглавиям, количеству выпущенных книг, особенностям рубрикации иногда вполне отчетливо заметны общественные настроения и какие-то преобладающие темы.

Что для меня было неожиданного по работе с архивом Летописей – прежде всего, наверное, было гораздо больше иностранной литературы, чем я ожидала (например, двенадцатитомные собрания сочинений Гёте и Гейне в 1937 году меня удивили). Количество изданий Пушкина, конечно, поражает, но вполне ожидаемо. Ещё интересно то, насколько больше новых авторов появляется в 1943 году по сравнению с 1937 – явно меняется установка с публикации собраний сочинений и каноничных авторов на публикацию современных поэтов.

В будущем очень хотела бы продолжать работать с электронным архивом Летописей – тем более, кажется, что в масштабных исследованиях советской литературы он незаменим.


 

  • Несколько библиотекарей высказали заинтересованность исследователей в применении средств компьютерного анализа информации для больших текстовых массивов распознанных записей российской национальной библиографии.

 

  • Андрей Муждаба, исследователь советской литературы 1920-30-х гг.:

Предлагаю добавить к коллекции дореволюционные Летописи.. Нас, среди прочего, интересуют кооперативные издательства, институциональных архивов которых не сохранилось (такие как "Издательство писателей в Ленинграде"), и "Летописи" являются, фактически, самым надежным способом подготовить аннотированный каталог таких издательств и направить их изучение в систематическое русло.  
 


  • Джон Гиллиан (Jon Giullian). Славистский библиотекарь, Канзаский университет (The Univ of Kansas):

Хотя Книжная летопись будет полезным информационным ресурсом, Летопись журнальных статей в оцифрованном виде будет наиболее востребованной из трех Летописей (КЛ, ЖЛ и ГЛ). Почему я так считаю? 

В данный момент наибольший информационный дефицит в российских исследованиях ощущается в области доступа к российской периодике, как исторической, так и текущей. И особенно исторической периодике и особенно на Западе. Двумя доступными указателями периодики в данный момент служат база данных Университета Индианы "Летопись журнальных статей 1956-1975 гг." и база данных Ист Вью, охватывающая  период  с 1994 года по текущий. Таким образом, у нас черная дыра для журналов, издававшихся с 1926 по 1955, и с 1976 по 1993 гг. Плюс нет ничего по  Летописи газетных статей до 1994 года. Восполнение этого пропуска путем оцифровки Летописей и предоставления к ним доступа по Интернет станет значительным достижением для исторических исследований. Если вы с РКП сможете сделать один электронный ресурс, который содержит все Летописи, то такой ресурс внесет значительный вклад в исследования.

В России сегодня много библиотек оцифровывают журналы и предоставляют к ним доступ по Интернет, но нет ни одного ресурса, который бы объединял это все вместе. За каждым журналом нужно гоняться отдельно, если конечно знать где искать. Всеобъемлющий указатель Журнальной летописи в электронном виде был бы бесценен потому что единственной и самой большой проблемой Летописей является то, что ими неудобно пользоваться в бумажном виде. Вы можете значительно улучшить электронную коллекцию Летописей, если будете добавлять возможность навигации по биб записям с помощью тематического и других указателей.

Касательно качества распознавания текстов Летописей  - ошибки в распознавании не представляют собой проблемы до тех пор, пока текст сопровождается имиджем соответствующей страницы. Если у кого то возникнет вопрос касательно ошибок в распознанном тексте, то рядом присутствует оригинальная страница Летописи, с которой текст можно сверить. Вместе с тем желательно со временем исправить ошибки OCR с целью улучшения полнотекстового поиска по коллекции. Это необходимо сделать со временем даже если эту работу придется делать руками.


 

  • Ирина Борисовна Титунова, библиограф Отдела научной информации Российской государственной библиотеки искусств (РГБИ):

С декабря 2018 в РГБИ была на тестировании  пилотная версия электронной коллекции "Книжной летописей" за 1917 - 1978 гг.


В целом база данных представляет большой интерес для библиотек, особенно не имеющий печатного комплекта Летописей. Безусловно, журнальная и газетные летописи будут более востребованы, чем Книжная, т.к. есть такие ретроспективные библиографические ресурсы, как база данных «Вся Россия» и Генеральный алфавитный каталог РНБ. Однако, электронная коллекция книжных летописей, представляющая дополнительные поисковые возможности, по сравнению с печатными аналогами, и значительно ускоряющая поиск материала, может быть использована в первую очередь в уточняющих и адресных запросах, если книги нет в конкретной библиотеке, а также в тематических, особенно при работе над библиографическими пособиями.

Безусловно, Летопись журнальных и Летопись газетных статей имеют больше перспектив в использовании при выполнении тематических запросов, поиске статей конкретного автора и т.д., т.к. многие источники отсутствуют даже в специализированных библиотеках, в которых велась самостоятельная роспись источников.  Мы сейчас активно используем базу Университета Индианы в дополнение к нашему Справочно-поисковому аппарату.

В идеале, единицей поиска должна быть одна библиографическая запись. Тогда можно будет организовать поиск по полям автора, заглавия, года и т.д. Мои замечания по полнотекстовому поиску прилагаю. Часть из них планируется устранить в вашем перспективном плане работы с базой, но мне показалось важным их указать. 
 


  • Б.Н. Миронов, Проф. С.-Петербургского гос. университета:

Проект, конечно, замечательный. Навигация удобная. После его завершения наше научное наследие шире войдет в научный оборот. Для историков это может быть особенно ценно.

Два соображения.

Указатели имен в книжных летописях приводятся поквартально - как в бумажных оригиналах. Если сделать указатель имен за год или за несколько лет, то скорость поиска нужной публикации ускорится в 4 и более раз. То же относится к другим летописям.

Для исследователей наиболее актуальны летописи  последних 30 лет, 1990-2019.
Вы делаете э/базу, начиная с 1917 г. Мне кажется, для пользователей было бы целесообразнее начать с другого конца.

Еще раз спасибо за большую и полезную работу.