Π”ΠΈΠΏΠ»ΠΎΠΌΡ‹, курсовыС, Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚Ρ‹, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Ρ‹Π΅...
Брочная ΠΏΠΎΠΌΠΎΡ‰ΡŒ Π² ΡƒΡ‡Ρ‘Π±Π΅

ВСхнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· элСктронных Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ²

Π”ΠΈΡΡΠ΅Ρ€Ρ‚Π°Ρ†ΠΈΡΠŸΠΎΠΌΠΎΡ‰ΡŒ Π² Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠΈΠ£Π·Π½Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒΠΌΠΎΠ΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠ΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π΄ΠΎΠΊΠ»Π°Π΄Ρ‹Π²Π°Π»ΠΈΡΡŒ Π½Π° Π½Π°ΡƒΡ‡Π½ΠΎ-практичСских конфСрСнциях: ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «ΠœΠ°Ρ‚СматичСскиС ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ» (Π‘ΡƒΠ΄Π²Π°, ЧСрногория, 2009 Π³.) — IX ΠΌΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «Π Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΠΎΠ±Ρ€Π°Π·ΠΎΠ² ΠΈ Π°Π½Π°Π»ΠΈΠ· ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ: Π½ΠΎΠ²Ρ‹Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ» (НиТний Новгород, 2008 Π³.) — XII, XIII ΠΈ XIV всСроссийской ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅… Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘ >

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

  • УсловныС обозначСния
  • Π“Π»Π°Π²Π° 1. Анализ процСсса извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ
    • 1. 1. Π’Π°Π±Π»ΠΈΡ†Ρ‹ Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ…
    • 1. 2. БтатистичСскиС Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 1. 3. Π€ΠΎΡ€ΠΌΠ°Ρ‚Ρ‹ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…
    • 1. 4. ΠœΠ΅Ρ‚Π°Ρ„Π°ΠΉΠ»Ρ‹
    • 1. 5. Π˜Π·Π²Π΅ΡΡ‚Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΡ‹
    • 1. 6. ВСхнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ
  • Π“Π»Π°Π²Π° 2. ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° страниц Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²
    • 2. 1. ΠžΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 2. 2. БистСма ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚
    • 2. 3. МодСль страницы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°
    • 2. 4. Π’Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠΎΠ²
    • 2. 5. Π’Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΊΠΎΠ²
    • 2. 6. ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΌΠ΅Ρ‚Π°Ρ„Π°ΠΉΠ»ΠΎΠ²
    • 2. 7. ΠŸΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° страницы
    • 2. 8. ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ† Π½Π° ΡΡ‚Ρ€Π°Π½ΠΈΡ†Π΅ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°
  • Π“Π»Π°Π²Π° 3. Анализ ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Ρ‚Π°Π±Π»ΠΈΡ†
    • 3. 1. МодСль Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 3. 2. ΠŸΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 3. 3. Анализ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 3. 4. БСгмСнтация Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 3. 5. МодСль структурного описания Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
    • 3. 6. Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
  • Π“Π»Π°Π²Π° 4. ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ²
    • 4. 1. Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Π°Ρ систСма извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ
    • 4. 2. ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠ΅ структурных описаний Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Π² XML
    • 4. 3. Π­ΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ ΠΎΡ†Π΅Π½ΠΊΠ°
    • 4. 4. Автоматизация Π²Π²ΠΎΠ΄Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…

ВСхнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· элСктронных Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ² (Ρ€Π΅Ρ„Π΅Ρ€Π°Ρ‚, курсовая, Π΄ΠΈΠΏΠ»ΠΎΠΌ, ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Π°Ρ)

ΠΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ исслСдования. Π’Π°Π±Π»ΠΈΡ†Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… способов прСдставлСния ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ…. Часто такая табличная информация ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ прСдставлСна Π² Π±Π°Π·Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Однако Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π΅ Π²ΡΠ΅Π³Π΄Π° доступны, ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹, содСрТат ΠΏΠΎΠ»Π½ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ. Π’ ΡΠ²ΡΠ·ΠΈ с ΡΡ‚ΠΈΠΌ Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Ρ‚Π°ΡŽΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, систСмы ΠΈ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚ΡŒ Π΅Ρ‘ ΠΊ Ρ‚Ρ€Π΅Π±ΡƒΠ΅ΠΌΠΎΠΌΡƒ Π²ΠΈΠ΄Ρƒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΊ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡΠΌ Π² Ρ€Π΅Π»ΡΡ†ΠΈΠΎΠ½Π½Ρ‹Ρ… Π±Π°Π·Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ….

ΠΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ подчСркиваСтся Π² ΠΎΠ±Π·ΠΎΡ€Π°Ρ… Π°Π²Ρ‚ΠΎΡ€ΠΎΠ² Handley J.C. (1999) [17], Lopresti D. ΠΈ Nagy G. (1999, 2000) [42, 43], Zanibbi R. (2004) [73, 74], Embley D.W. (2006) [10, 11], e Silva A.C. (2006) [9], ПолСвого Π”. Π’. (2007) [84]. Π’ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ выдСляСтся нСсколько Π·Π°Π΄Π°Ρ‡ связанных с ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ: 1) ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ — поиск Π½Π° ΡΡ‚Ρ€Π°Π½ΠΈΡ†Π°Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² областСй, ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‰ΠΈΡ… Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹- 2) сСгмСнтация — Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Π½Π° ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ ячСйки, строки, столбцы- 3) Π°Π½Π°Π»ΠΈΠ· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк — ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ ячСйки Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ (ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π»ΠΈ ΠΎΠ½ΠΈ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠ°ΠΌΠΈ ΠΈΠ»ΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ) — 4) структурный Π°Π½Π°Π»ΠΈΠ· — ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ связСй ΠΌΠ΅ΠΆΠ΄Ρƒ ячСйками Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹.

НСсмотря Π½Π° Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π² ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ Π³ΠΎΠ΄Ρ‹ появились Ρ€Π°Π±ΠΎΡ‚Ρ‹, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ΡΡ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΡ‹ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², нСльзя ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ эту ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ Ρ€Π΅ΡˆΠ΅Π½Π½ΠΎΠΉ. Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ автоматичСского извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΎΠΌ обусловлСна большим Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ΠΌ Ρ„ΠΎΡ€ΠΌ изобраТСния Ρ‚Π°Π±Π»ΠΈΡ†. Π˜Π·Π²Π΅ΡΡ‚Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΡ‹ прСимущСствСнно ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π½Π° Π·Π°Ρ€Π°Π½Π΅Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ структуры ΠΈ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ Ρ‚Π°Π±Π»ΠΈΡ†, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ связаны со ΡΡ‚Π°Π½Π΄Π°Ρ€Ρ‚Π°ΠΌΠΈ Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠΉ ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области. ΠžΡ‚ ΡΡ‚ΠΎΠ³ΠΎ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΎΠΌ зависит ΠΈΡ… ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ. ΠŸΡ€ΠΈ этом ΠΎΠ½ΠΈ, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Ρ€Π΅ΡˆΠ°ΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠ»ΠΈ ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ Ρ‚Π°Π±Π»ΠΈΡ†.

АвтоматичСскоС ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΈ ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚ация Ρ‚Π°Π±Π»ΠΈΡ† выполняСтся Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… систСмах оптичСского распознавания тСкста, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, «OmniPage» (Nuance Communications), «Cuneiform» (Cognitive Technologies), «FineReader» (ABBYY). ΠŸΠ΅Ρ€Π΅Ρ‡ΠΈΡΠ»Π΅Π½Π½Ρ‹Π΅ систСмы ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π½Π° «Ρ€Π΅ΡˆΡ‘Ρ‚ΠΎΡ‡Π½ΡƒΡŽ» структуру Ρ‚Π°Π±Π»ΠΈΡ†, Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π½ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹ΠΌ процСссорам, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Excel. Π­Ρ‚ΠΎ сниТаСт ΠΈΡ… ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ для обнаруТСния ΠΈ ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΠΈ Ρ‚Π°Π±Π»ΠΈΡ† со ΡΠ»ΠΎΠΆΠ½Ρ‹ΠΌΠΈ структурами Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ². ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, оптичСскоС распознаваниС символов выполняСтся с ΠΏΠΎΡ‚Срями ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. Π’ ΡΠΈΡΡ‚Π΅ΠΌΠ°Ρ… «PDF2XL» (Cogniview) ΠΈ «Solid Converter PDF» (Solid Documents), Π² Ρ‡Π°ΡΡ‚ности, выполняСтся ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠ· Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² PDF Π² Ρ„Π°ΠΉΠ»Ρ‹ Excel/Word. Π­Ρ‚ΠΈ систСмы Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π½Π° «Ρ€Π΅ΡˆΡ‘Ρ‚ΠΎΡ‡Π½ΡƒΡŽ» структуру Ρ‚Π°Π±Π»ΠΈΡ† ΠΈ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΡ… ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΈ ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ.

Π’ ΡΡ‚атистичСских ΠΎΡ‚Ρ‡Π΅Ρ‚Π°Ρ… (государствСнных, мСдицинских, финансовых) основная информация прСдставлСна Π² Π²ΠΈΠ΄Π΅ Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… статистичСских Ρ‚Π°Π±Π»ΠΈΡ†1. Π’Π½Π΅ зависимости ΠΎΡ‚ Π½Π°Ρ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ»ΠΈ ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ принадлСТности Ρ‚Π°ΠΊΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ достаточно схоТСй структурой. Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Ρ‚Π°ΠΊΠΈΡ… ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΎΠ² доступно Π² ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½ΠΎΠΌ Π²ΠΈΠ΄Π΅, Π³Π΄Π΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΌΠ°ΡˆΠΈΠ½ΠΎΡ‡ΠΈΡ‚Π°Π΅ΠΌΡ‹ΠΌ тСкстом, Ρ‚. Π΅. элСктронным тСкстом, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ хранится Π² Π²ΠΈΠ΄Π΅ строк символов. Однако Π² Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ Π½Π΅ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½Ρ‹ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈΠ»ΠΈ систСмы извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ с ΠΎΠ΄Π½ΠΎΠΉ стороны ΡΠ²Π»ΡΡŽΡ‚ΡΡ комплСксными, Ρ‚. Π΅. Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅, ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ, Π°Π½Π°Π»ΠΈΠ· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Ρ‚Π°Π±Π»ΠΈΡ†, Π° Ρ Π΄Ρ€ΡƒΠ³ΠΎΠΉ стороны ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π½Π° ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Ρƒ ΠΈ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ статистичСских Ρ‚Π°Π±Π»ΠΈΡ†, Π² Ρ‡Π°ΡΡ‚ности, ΠΏΡƒΠ±Π»ΠΈΠΊΡƒΠ΅ΠΌΡ‹Ρ… Росстатом. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° комплСксной Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎ.

1 «Π‘ΠΎΠ»ΡŒΡˆΠ°Ρ совСтская энциклопСдия. Изд. 3-Π΅» — М.: БовСтская энциклопСдия. Π’.25 «Π‘Ρ‚Ρ€ΡƒΠ½ΠΈΠ½ΠΎ-Π’ΠΈΡ…ΠΎΡ€Π΅Ρ†ΠΊ». 1976. Π‘. 161−162. http://slovari.yandex.ru/dict/bse/article/000T7/8 800.htm Π³ΠΈΠΈ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, которая ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΏΠ° ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Ρƒ ΠΈ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ статистичСских Ρ‚Π°Π±Π»ΠΈΡ†, прСдставлСнных Π² Π²ΠΈΠ΄Π΅ ΠΌΠ°ΡˆΠΈΠ½ΠΎΡ‡ΠΈΡ‚Π°Π΅ΠΌΠΎΠ³ΠΎ тСкста Π² ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ…, являСтся Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ.

ЦСль диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹ состоит Π² ΡΠΎΠ·Π΄Π°Π½ΠΈΠΈ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ², которая Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅, ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ, Π°Π½Π°Π»ΠΈΠ· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· статистичСских Ρ‚Π°Π±Π»ΠΈΡ†.

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹.

1. Анализ прСдставлСния статистичСских Ρ‚Π°Π±Π»ΠΈΡ† Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ….

2. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ страницы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° ΠΈ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π½Ρ‹Ρ… для прСдставлСния Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅Π½Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°.

3. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² автоматичСского обнаруТСния, сСгмСнтации, Π°Π½Π°Π»ΠΈΠ·Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк pi ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° статистичСских Ρ‚Π°Π±Π»ΠΈΡ† Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

4. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ систСмы извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ².

5. ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° созданной Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π½Π° Π·Π°Π΄Π°Ρ‡Π°Ρ… Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ†ΠΈΠΈ Π²Π²ΠΎΠ΄Π° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… статистичСских ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΎΠ² Π² Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ….

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ исслСдования: тСория мноТСств, тСория Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…, ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ машинной Π³Ρ€Π°Ρ„ΠΈΠΊΠΈ, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎ-ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ΅ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅.

Научная Π½ΠΎΠ²ΠΈΠ·Π½Π°. Π’ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° тСхнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, прСдставлСнной Π² Π²ΠΈΠ΄Π΅ ΠΌΠ°ΡˆΠΈΠ½ΠΎΡ‡ΠΈΡ‚Π°Π΅ΠΌΠΎΠ³ΠΎ тСкста Π² ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ², которая ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π° Π½Π° ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Ρƒ ΠΈ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ статистичСских Ρ‚Π°Π±Π»ΠΈΡ† ΠΈ ΡΠ²Π»ΡΠ΅Ρ‚ся комплСксной, Ρ‚. Π΅. выполняСт ΠΈΡ… ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅, ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ, Π°Π½Π°Π»ΠΈΠ· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ·.

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠ°Ρ Π·Π½Π°Ρ‡ΠΈΠΌΠΎΡΡ‚ΡŒ. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… извлСчСния ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. Π’ Ρ‡Π°ΡΡ‚ности, прСдлагаСмая тСхнология ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ†ΠΈΠΈ Π²Π²ΠΎΠ΄Π° Π² Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΡ‚атистичСских Ρ‚Π°Π±Π»ΠΈΡ†, прСдставлСнных Π² Π²ΠΈΠ΄Π΅ ΠΌΠ°ΡˆΠΈΠ½ΠΎΡ‡ΠΈΡ‚Π°Π΅ΠΌΠΎΠ³ΠΎ тСкста Π² ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ². ΠŸΡ€ΠΈ этом данная тСхнология позволяСт ΡΠ½ΠΈΠ·ΠΈΡ‚ΡŒ Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ ΠΈ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ качСство формирования Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ…. Π Π°Π±ΠΎΡ‚Π° Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Π° ΠΏΡ€ΠΈ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ΅ РЀЀИ, Π³Ρ€Π°Π½Ρ‚ 09−07−12 017;ΠΎΡ„ΠΈΠΌ.

Π’Π½Π΅Π΄Ρ€Π΅Π½ΠΈΠ΅. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ использовались Π² ΠœΠΈΠ½ΠΈΡΡ‚СрствС сСльского хозяйства Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊΠΎΠΉ области для Π²Π²ΠΎΠ΄Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… статистичСских ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΎΠ² Π’Π΅Ρ€Ρ€ΠΈΡ‚ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΎΡ€Π³Π°Π½Π° Ρ„Π΅Π΄Π΅Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ слуТбы государствСнной статистики ΠΏΠΎ Π˜Ρ€ΠΊΡƒΡ‚ской области (Π˜Ρ€-кутскстата) Π² Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… (Π‘Π”) Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ систСмы (АИБ) «ΠšΠ°ΡΠΊΠ°Π΄». ΠŸΡ€Π΅Π΄Π»Π°Π³Π°Π΅ΠΌΠ°Ρ тСхнология Π²Π½Π΅Π΄Ρ€Π΅Π½Π° Π² Π˜Π½ΡΡ‚ΠΈΡ‚ΡƒΡ‚Π΅ систСм энСргСтики ΠΈΠΌ. JI.A. ΠœΠ΅Π»Π΅Π½Ρ‚ΡŒΠ΅Π²Π° БО РАН, Π³Π΄Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΏΡ€ΠΈ создании Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π° Π΄Π°Π½Π½Ρ‹Ρ… Π² ΡΠΎΡΡ‚Π°Π²Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ инфраструктуры исслСдований Π² ΡΠ½Π΅Ρ€Π³Π΅Ρ‚ΠΈΠΊΠ΅.

Π—Π°Ρ‰ΠΈΡ‰Π°Π΅ΠΌΡ‹Π΅ полоТСния.

1. МодСль страницы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, которая слуТит для прСдставлСния Π΄Π°Π½Π½Ρ‹Ρ… страницы, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ.

2. МодСль структурного описания Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, которая ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π° для прСдставлСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ² ΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, Π° Ρ‚Π°ΠΊΠΆΠ΅ связСй ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ.

3. ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ обнаруТСния, сСгмСнтации, Π°Π½Π°Π»ΠΈΠ·Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° статистичСских Ρ‚Π°Π±Π»ΠΈΡ†, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΠ²Π°ΡŽΡ‚ ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, содСрТащСйся Π² ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ….

Π›ΠΈΡ‡Π½Ρ‹ΠΉ Π²ΠΊΠ»Π°Π΄ Π°Π²Ρ‚ΠΎΡ€Π°. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Ρ‹ Π°Π²Ρ‚ΠΎΡ€ΠΎΠΌ Π»ΠΈΡ‡Π½ΠΎ, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ: ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Ρ‹ модСль страницы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, эвристичСскиС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обнаруТСния, сСгмСнтации, Π°Π½Π°Π»ΠΈΠ·Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° статистичСских Ρ‚Π°Π±Π»ΠΈΡ†Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π° информационная систСма для извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΠΌΠ΅Ρ‚Π°Ρ„Π°ΠΉΠ»ΠΎΠ² EMF (Enhanced Metafiles) — создана тСхнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ². Π’ Π½Π΅Π΄Π΅Π»ΠΈΠΌΠΎΠΌ соавторствС с А. Π•. Π₯ΠΌΠ΅Π»ΡŒΠ½ΠΎΠ²Ρ‹ΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π° модСль структурного описания Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹. Π’ Π½Π΅Π΄Π΅Π»ΠΈΠΌΠΎΠΌ соавторствС с А. Π•. Π₯ΠΌΠ΅Π»ΡŒΠ½ΠΎΠ²Ρ‹ΠΌ, И. Π’. Π‘Ρ‹Ρ‡ΠΊΠΎΠ²Ρ‹ΠΌ ΠΈ Π“. Πœ. Π ΡƒΠΆ-Π½ΠΈΠΊΠΎΠ²Ρ‹ΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅ΠΌΠΎΠΉ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ для Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ†ΠΈΠΈ Π²Π²ΠΎΠ΄Π° статистичСской ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… АИБ «ΠšΠ°ΡΠΊΠ°Π΄». Π’ Ρ€Π°Π±ΠΎΡ‚Π°Ρ… [89−91, 94, 95] Π°Π²Ρ‚ΠΎΡ€ΠΎΠΌ Π»ΠΈΡ‡Π½ΠΎ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ эвристичСский ΠΌΠ΅Ρ‚ΠΎΠ΄ обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ† ΠΈ Ρ‚Схнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ². Π’ Ρ€Π°Π±ΠΎΡ‚Π°Ρ… [92, 97−99] Π°Π²Ρ‚ΠΎΡ€ΠΎΠΌ Π² Π½Π΅Π΄Π΅Π»ΠΈΠΌΠΎΠΌ соавторствС с А. Π•. Π₯ΠΌΠ΅Π»ΡŒΠ½ΠΎΠ²Ρ‹ΠΌ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° модСль структурного описания Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹.

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠ΅ Ρ€Π°Π±ΠΎΡ‚Ρ‹. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π΄ΠΎΠΊΠ»Π°Π΄Ρ‹Π²Π°Π»ΠΈΡΡŒ Π½Π° Π½Π°ΡƒΡ‡Π½ΠΎ-практичСских конфСрСнциях: ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «ΠœΠ°Ρ‚СматичСскиС ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ» (Π‘ΡƒΠ΄Π²Π°, ЧСрногория, 2009 Π³.) — IX ΠΌΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «Π Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΠΎΠ±Ρ€Π°Π·ΠΎΠ² ΠΈ Π°Π½Π°Π»ΠΈΠ· ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ: Π½ΠΎΠ²Ρ‹Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ» (НиТний Новгород, 2008 Π³.) — XII, XIII ΠΈ XIV всСроссийской ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ ΠΈ ΠΌΠ°Ρ‚СматичСскиС Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π² Π½Π°ΡƒΠΊΠ΅ ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ» (Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2007, 2008, 2009 Π³Π³.) — ВсСроссийской ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «ΠœΠ°Ρ‚СматичСскоС ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ-ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π² ΠΌΠ΅ΠΆΠ΄ΠΈΡΡ†ΠΈΠΏΠ»ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… исслСдованиях» (Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2009 Π³.) — VI ΠΈ IX школС-сСминарС «ΠœΠ°Ρ‚СматичСскоС ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ» (Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2005, 2007 Π³Π³.) — Π¨ΠΊΠΎΠ»Π΅-сСминарС ΠΌΠΎΠ»ΠΎΠ΄Ρ‹Ρ… ΡƒΡ‡Π΅Π½Ρ‹Ρ… «Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… эколого-экономичСских систСм» (Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2008 Π³.) — сСминарС «Π›ΡΠΏΡƒΠΏΠΎΠ²ΡΠΊΠΈΠ΅ чтСния ΠΈ ΠΏΡ€Π΅Π·Π΅Π½Ρ‚ация ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ» (Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2007, 2008, 2009 Π³Π³.).

ΠŸΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ. По Ρ‚Π΅ΠΌΠ΅ диссСртации ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ΠΎ 12 Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… Ρ€Π°Π±ΠΎΡ‚ [88−99], Π² Ρ‚. Ρ‡. 3 ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ [88−90] Π² ΠΈΠ·Π΄Π°Π½ΠΈΡΡ…, Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π’ΠΠš. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½ΠΎ 4 ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²Π° ΠΎΠ± ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ рСгистрации ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌ для Π­Π’Πœ Π² Π ΠΎΡΠΏΠ°Ρ‚Π΅Π½Ρ‚Π΅ [100−103]: Π–№ 2 008 614 328, 2 008 614 330, 2 008 614 331, 2 008 614 332 (2008 Π³.).

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

.

ДиссСртационная Ρ€Π°Π±ΠΎΡ‚Π° посвящСна Π·Π°Π΄Π°Ρ‡Π°ΠΌ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ². Π’ Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π΅ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ΡΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΠ° для извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΡ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠ·Π²Π»Π΅ΠΊΠ°Π΅ΠΌΡ‹Π΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ прСдставлСны Π² Π²ΠΈΠ΄Π΅ ΠΌΠ°ΡˆΠΈΠ½ΠΎΡ‡ΠΈΡ‚Π°Π΅ΠΌΠΎΠ³ΠΎ тСкста. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ ΡΠΈΡΡ‚Π΅ΠΌΡ‹ ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅ΠΌΡƒΡŽ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΡŽ. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π°Π½Π°Π»ΠΈΠ·Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², извлСчСния ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ.

Π’ Ρ€Π°ΠΌΠΊΠ°Ρ… диссСртационной Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Ρ‹ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ основныС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

1. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π° модСль страницы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, которая слуТит для прСдставлСния Π΄Π°Π½Π½Ρ‹Ρ… страницы, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… Π² ΠΏΡ€ΠΎΡ†Π΅ΡΡΠ΅ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ².

2. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π° модСль структурного описания Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, которая ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π° для прСдставлСния Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ² ΠΈ Π΄Π°Π½Π½Ρ‹Ρ… Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, Π° Ρ‚Π°ΠΊΠΆΠ΅ связСй ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ.

3. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обнаруТСния, сСгмСнтации, Π°Π½Π°Π»ΠΈΠ·Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Ρ‚Π°Π±Π»ΠΈΡ†, ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ Π½Π° ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Ρƒ ΠΈ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ статистичСских Ρ‚Π°Π±Π»ΠΈΡ†.

ΠŸΡ€Π΅Π΄Π»Π°Π³Π°Π΅ΠΌΠ°Ρ тСхнология ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π·Π²ΠΈΠ²Π°Ρ‚ΡŒΡΡ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… направлСниях.

1. ИспользованиС словаря словоформ русского языка для объСдинСния частСй ΠΎΠ΄Π½ΠΎΠ³ΠΎ слова (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π² Ρ‚Π΅Ρ… случаях, ΠΊΠΎΠ³Π΄Π° Π² Ρ‚СкстС Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ пСрСносы слов).

2. ИспользованиС словарСй ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… слов (Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ² Ρ‚Π°Π±Π»ΠΈΡ† спСцифичных для Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области) для поиска Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ² столбцов, строк ΠΈ ΠΏΠ΅Ρ€Π΅Ρ€Π΅Π·ΠΎΠ² Ρ‚Π°Π±Π»ΠΈΡ†.

3. ИспользованиС Π°Π½Π°Π»ΠΈΠ·Π° Ρ€Π°Π·Π³Ρ€Π°Ρ„ΠΊΠΈ Ρ‚Π°Π±Π»ΠΈΡ† Π² ΠΊΠ°Ρ‡Π΅ΡΡ‚Π²Π΅ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ срСдства обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ†.

Π­Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ Π±ΠΎΠ»Π΅Π΅ эффСктивно (Ρ‚ΠΎΡ‡Π½ΠΎ ΠΈ ΠΏΠΎΠ»Π½ΠΎ) Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅, ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ, Π°Π½Π°Π»ΠΈΠ· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ячССк ΠΈ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· статистичСских Ρ‚Π°Π±Π»ΠΈΡ†.

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ вСсь тСкст

Бписок Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹

  1. Amano A., Asada N., Mukunoki M., Aoyama M. Table form document analysis based on the document structure grammar // 1. ternational Journal of Document Analysis. Springer-Verlag. 2006. Vol. 8, No 2−3. P. 201−213.
  2. Amano A., Asada N. Graph Grammar Based Analysis System of Complex Table Form Document //In Proc. Tth International Conference on Document Analysis and Recognition. IEEE Computer Society. 2003. Vol. 2. P. 916−920.
  3. Cesarini F., Marinai S., Sarti L., Soda G. Trainable table location document images //In Proc. 16th International Conference on Pattern Recognition (ICPR 02). IEEE Computer Society. 2002. Vol. 3. P. 236−240.
  4. Chandran S., Kasturi R. Structural recognition of tabulated data //In Proc. 2nd International Conference on Document Analysis and Recognition (ICDAR 93). Japan. IEEE Computer Society. 1993, P. 516−519.
  5. Cohen W.W., Hurst M., Jensen L.S. A flexible learning system for wrapping tables and lists in HTML documents //In Proc. 11th International World Wide Web Conference. USA. 2002. P. 232−241.
  6. Douglas S., Hurst M., David Q. Using Natural Language Processing for Identifying and Interpreting Tables in Plain Text //In Proc. 4th Annual
  7. Embley D.W., Hurst M., Lopresti D., Nagy G. Table-processing paradigms: a research survey // International Journal on Document Analysis and Recognition. Springer-Verlag. 2006. Vol. 8, No. 2. P. 66−86.
  8. Embley D.W., Lopresti D., Nagy G. Notes on Contemporary Table Recognition //In Proc. 7th Int. Workshop on Document Analysis Systems. Springer-Verlag. 2006. P. 164−175.
  9. Gatterbauer W., Bohunsky P., Herzog M., Krupl Π’., Pollak B. Towards domain independent information extraction from Web tables //In Proc. 16th International World Wide Web Conference. Canada. ACM. 2007. P. 71−80.
  10. Gatterbauer W., Bohunsky P. Table extraction using spatial reasoning on the CSS2 visual box model // In Proc. 21st AAAI. AAAI Press. 2006. P. 1313−1318.
  11. Green E., Krishnamoorthy M. Model-based analysis of printed tables // In Proc. 3rd International Conference on Document Analysis and Recognition (ICDAR 95). IEEE Computer Society. 1995. Vol. 1. P. 214−217.
  12. Handley J.C. Document recognition // Electronic Imaging Technology. Chapter 8. IS&T/SPIE Optical Engineering Press. 1999. P. 289−316.
  13. Handley J.C. Table analysis for multiline cell identification // In Proc. Document Recognition and Retrieval VIII. SPIE. Vol. 4307−04. P. 34−43.
  14. Hassan Π’., Baumgartner R. Table Recognition and Understanding from PDF Files // In Proc. 9th International Conference on Document Analysis and Recognition (ICDAR 2007). IEEE Computer Society. 2007. P. 1143−1147.
  15. Hirayama Y. A method for table structure analysis using DP matching // In Proc. 3rd International Conference on Document Analysis and Recognition (ICDAR 95). Canada. IEEE Computer Society. 1995. P. 583−586.
  16. Hori O., Doermann D.S. Robust table-form structure analysis based on box-driven reasoning //In Proc. 3rd International Conference on Document Analysis and Recognition. IEEE Computer Society. 1995. Vol. 1. P. 218−221.
  17. HTML 4.01 Specification, http: //www. w3. org/TR/html4.
  18. Hu J., Kashi R., Lopresti D., Wilfong G. Table Structure Recognition and its Evaluation //In Proc. Document Recognition and Retrieval VIII. USA. IS&T/SPIE Electronic Imaging. 2001. Vol. 4307 P. 44−55.
  19. Hu J., Kashi R., Lopresti D., Wilfong G. Medium-Independent Table
  20. Detection //In Proc. Document Recognition and Retrieval VII. USA. IS&T/SPIE Electronic Imaging. 2000. P. 291−302.
  21. Hurst M. A constraint-based approach to table structure derivation // In Proc. 7th International Conference on Document Analysis and Recognition (ICDAR 2003). IEEE Computer Society. 2003. P. 911−915.
  22. Hurst M. Layout and Language: An Efficient Algorithm for Text Block Detection based on Spatial and Linguistic Evidence // Document Recognition and Retrieval VIII. USA. SPIE. 2001. Vol. 4307. P. 55−67.
  23. Hurst M. Layout and language: challenges for table understanding on the web //In Proc. First International Workshop on Web Document Analysis. Seattle. 2001. P. 27−30.
  24. Hurst M., Douglas S. Layout and Language: Preliminary investigations in recognizing the structure of tables //In Proc. 4th International Conference on Document Analysis and Recognition (ICDAR 97). Germany. IEEE Computer Society. 1997. P. 1043−1047.
  25. Itonori K. A table structure recongnition based on textblock arrangement and ruled line position //In Proc. 2nd International Conference on Document Analysis and Recognition (ICDAR 93). Japan. IEEE Computer Society. 1993. P. 765−768.
  26. Kieninger T. Table structure recognition based on robust block segmentation // In Proc. Document Recognition V. USA. IS&T/SPIE Electronic Imaging. 1998. Vol. 3305. P. 22−32.
  27. Kieninger Π’., Dengel A. Applying the T-Recs table recognition system to the business letter domain //In Proc. 6th International Conference on Document
  28. Analysis and Recognition (ICDAR 2001). IEEE Computer Society. 2001. R 518−522.
  29. Kieninger Π’., Dengel A. The T-Recs Table Recognition and Analysis System // Lecture Notes in Computer Science. Springer-Verlag. 1999. Vol. 1655. R 255−270.
  30. Klein Π’., Gokkus S., Kieninger Π’., Dengel A. Three Approaches to Industrial Table Spotting //In Proc. 6th International Conference on Document Analysis and Recognition (ICDAR 2001). USA. IEEE Computer Society. 2001. P. 513−517.
  31. Kojima H., Akiyama Π’., Table Recognition for Automated Document Entry System // SPIE Vol. 1384, High Speed Inspection Architectures, Barcoding, and Character Recognition. 1990. P. 285−292.
  32. Kriipl Π’., Herzog M., Gatterbauer W. Using Visual Cues for Extraction of Tabular Data from Arbitrary HTML Documents // In Proc. 14th International Conference on World Wide Web. Japan. ACM. 2005. P. 1000−1001.
  33. Kriipl Π’., Herzog M. Visually guided bottom-up table detection and segmentation in web documents //In Proc. 15th International Conference on World Wide Web. Scotland. ACM. 2006. P. 933−934.
  34. T.A., Secic M. «How to Report Statistics in Medicine: Annotated Guidelines for Authors, Editors, and Reviewers (2nd edition)». American College of Physicians, 2006. 490 c.
  35. Lerman K., Getoor L., Minton S., Knoblock C. Using the structure of Web sites for automatic segmentation of tables //In Proc. 2004 ACM SIGMOD International Conference on Management of Data. ACM. 2004. P. 119−130.
  36. Li J., Tang J., Song Q. Xu P. Table Detection from Plain Text Using Machine Learning and Document Structure // Lecture Notes in Computer Science. Springer-Verlag. 2006. Vol. 3841/2006. P. 818−823.
  37. Liu Y., Bai K., Mitra P., Giles C. Searching for Tables in Digital Documents //In Proc. 9th International Conference on Document Analysis and Recognition. IEEE Computer Society. 2007. Vol. 2. P. 934−938.
  38. Lopresti D., Nagy G. A tabular survey of automated table processing // Lecture Notes in Computer Science. Springer-Verlag. 2000. Vol. 1941. P. 93−120.
  39. Lopresti D., Nagy G. Automated table processing: An (opinionated) survey // Third IAPR International Workshop on Graphics Recognition. India. 1999. P. 109−134.
  40. Mandal S., Chowdhury S.P., Das A.K., Chanda B. A simple and effective table detection system from document images // International Journal on Document Analysis and Recognition. Springer-Verlag. 2006. Vol. 8, No. 2. P. 172−182.
  41. Mandal S., Chowdhury S.P., Das A.K., Chanda B. A Complete System for Detection and Identification of Tabular Structures from Document Images // Lecture Notes in Computer Science. Springer-Verlag. 2004. Vol. 3212/2004. P. 217−225.
  42. Microsoft Developer Network, http://msdn.microsoft.com.
  43. Ng H.T., Lim C.Y., Li Teng Koo J. Learning to recognize tables in free text //In Proc. 37th Annual Meeting of the Association for Computational Linguistics. USA. 1999. P. 443−450.
  44. Pyreddy P., Croft W.B. A System for Retrieval in Text Tables // Technical report. University of Massachusetts, USA. 1997.
  45. Pyreddy P., Croft W.B. Tintin: a system for retrieval in text tables //In Proc. 2nd International Conference on Digital Libraries. USA. 1997. P. 193−200.
  46. Ramel J.-Y., CrucianuM., Vincent N., FaureC. Detection, Extraction and Representation of Tables // In Proc. 7th International Conference on Document Analysis and Recognition (ICDAR 2003). IEEE Computer Society. 2003, Vol. 2. P. 374−379.
  47. Rus D., Summers K. // Using White Space for Automated Document Structuring // Technical Report TR94−1452. Cornell University, USA. 1994. 33 c.
  48. Shamillian J. H., Baird H.S., Wood T.L. A retargetable table reader // In Proc. 4th International Conference on Document Analysis and Recognition (ICDAR 97). IEEE Computer Society. 1997. P. 448−453.
  49. Tengli A., Yang Y., Ma N.L. Learning table extraction from examples // In Proc. 20th International Conference on Computational Linguistics. Switzerland. Association for Computational Linguistics. 2004. P. 987−993.
  50. Tersteegen W.T., Wenzel C. Scantab: Table recognition by reference tables // In Proc. 3rd IAPR Workshop on Document Analysis Systems (DAS 98). Japan. 1998. P. 356−365.
  51. Tuerino Y. A., Embley D. W., Lonsdale D. W., Ding Y., Nagy G. Towards ontology generation from tables. // World Wide Web. Kluwer Academic Publishers. 2005. Vol. 8, No. 3. P. 261−285.
  52. Tupaj S., Shi Z., Chang Π‘. H., Alam H. Extracting Tabular Information From Text Files // EECS Department, Tufts University, Medford, USA. 1996. 18 c. (http://citeseer.nj .nec.com).
  53. Wang Y. Document analysis: Table Structure Understanding and Zone Content Classification, Ph.D. thesis // University of Washington, USA. 2002. 179 c.
  54. Wang Y., Hu J. A machine learning based approach for table detection on the web //In Proc. 11th International World Wide Web Conference. 2002. P. 242−250.
  55. Wang Y., Hu J. Detecting tables in HTML documents // Lecture notes in computer science. Springer-Verlag. 2002. Vol. 2423. P. 249−260.
  56. Wang Y., Phillips I.Π’., Haralick R. Table detection via probability-optimization // Lecture Notes In Computer Science. Springer-Verlag. 2002. Vol. 2423. P. 272−282.
  57. Wasserman H.C., Yukawa K, Sy B. K, Kwok K.-L., Phillips I.T. A Theoretical Foundation and a Method for Document Table Structure Extraction and Decompositon // Lecture Notes In Computer Science. Springer-Verlag. 2002. Vol. 2423. P. 291−294.
  58. Watanabe Π’., Quo Q.L., Sugie N. Layout recognition of multikinds of table-form documents // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1995. Vol. 17, No 4, P. 432−445.
  59. Weizsacker L., Fiirnkranz J. On Table Extraction from Text Sources with Markups // Technical Report TUD-KE-2008−05. Knowledge Engineering group, Technical University Darmstadt, Germany. 2008. 22 c.
  60. XHTML 1.0 The Extensible Hypertext Markup Language, Second Edition, http://www.w3.org/TR/xhtml1.
  61. Xi D. Lee S.-W. Table Structure Extraction from Form Documents Based on Gradient-Wavelet Scheme // Lecture Notes in Computer Science. Springer-Verlag. 1999. Vol. 1655/1999. P. 240−254.
  62. Yoshida M., Torisawa K., Tsujii J. A method to integrate tables of the World Wide Web //In Proc. 1st International Workshop on Web Document Analysis. USA. 2001. P. 31−34.
  63. Zanibbi R. A Language for Specifying and Comparing Table Recognition Strategies, Ph.D. thesis // Queen’s University Kingston, Canada. 2004. 236 c.
  64. Zanibbi R., Blostein D., Cordy J. R. A survey of table recognition: Models, observations, transformations, and inferences // International Journal on Document Analysis and Recognition. Springer-Verlag. 2004. Vol. 7, No. 1. P. 1−16.
  65. Π’.А. «Π ΡƒΡ‡Π½ΠΎΠΉ Π½Π°Π±ΠΎΡ€», М. 1985. 289 с. 78. ΠΏΠΎΠ΄ Ρ€Π΅Π΄. Бащинского Π‘. Π•., Власова Π’. Π’. «Π Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ ΠΏΠΎ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ΅ Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… мСдицинских ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΉ: Π‘Π±ΠΎΡ€Π½ΠΈΠΊ статСй ΠΈ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²». М. МСдиа Π‘Ρ„Π΅Ρ€Π°. 2006. 459 с.
  66. JI.A. «ΠžΡΠ½ΠΎΠ²Ρ‹ Π½Π°Π±ΠΎΡ€Π½Ρ‹Ρ… процСссов», М. 1986. 416 с.
  67. Π“ΠžΠ‘Π’ 2.105−95 Π•Π‘ΠšΠ” «ΠžΠ±Ρ‰ΠΈΠ΅ трСбования ΠΊ Ρ‚Скстовым Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°ΠΌ» — М.: ИПК Π˜Π·Π΄Π°Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎ стандартов, 2001. 27 с.
  68. А.Π­. «Π˜Π·Π΄Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΠΉ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ-справочник» — М.: ΠžΠ›ΠœΠ-ΠŸΡ€Π΅ΡΡ, 2003. 560 с.
  69. А.Π­., Π§Π΅Π»ΡŒΡ†ΠΎΠ²Π° JI.K. «Π‘ΠΏΡ€Π°Π²ΠΎΡ‡Π½ΠΈΠΊ издатСля ΠΈ Π°Π²Ρ‚ΠΎΡ€Π°. Π Π΅Π΄Π°ΠΊ-Ρ†ΠΈΠΎΠ½Π½ΠΎ-ΠΈΠ·Π΄Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΎΠ΅ ΠΎΡ„ΠΎΡ€ΠΌΠ»Π΅Π½ΠΈΠ΅ издания, 2-Π΅ ΠΈΠ·Π΄Π°Π½ΠΈΠ΅», М. Олимп. 2003. 800 с. 83. ΠΏΠΎΠ΄ Ρ€Π΅Π΄. ΠœΠΈΠ»ΡŒΡ‡ΠΈΠ½Π° А. Π­. «Π‘правочная ΠΊΠ½ΠΈΠ³Π° Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Π° ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΎΡ€Π°», М. 1985. 576 с.
  70. Π”.Π’. «Π’Π°Π±Π»ΠΈΡ†Ρ‹ Π² ΡΠΈΡΡ‚Π΅ΠΌΠ°Ρ… ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²». М. Π›ΠšΠ˜, 2007. 48 с.
  71. Π”.Π’. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΈ ΡΡ€Π΅Π΄ΡΡ‚Π² ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Ρ‚Π°Π±Π»ΠΈΡ‡Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π² ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… систСмах: АвторСф. дис. ΠΊΠ°Π½Π΄. Ρ‚Π΅Ρ…. Π½Π°ΡƒΠΊ. МЀВИ, 2007. 21 с.
  72. А.Π•. Π―Π·Ρ‹ΠΊ FlexT для спСцификации Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…. Дис. ΠΊΠ°Π½Π΄. Ρ‚Π΅Ρ…. Π½Π°ΡƒΠΊ. Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ. 2000. 118 с.
  73. А.Π•. Π‘Π²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎ ΠΎΠ± ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ рСгистрации ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹ для Π­Π’Πœ № 2 008 614 995 «Π Π°Π±ΠΎΡ‡ΠΈΠ΅ мСсто администратора Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π° статистичСской ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ (AttrTree)» / Π‘Ρ‹Ρ‡ΠΊΠΎΠ² И. Π’., Π ΡƒΠΆΠ½ΠΈΠΊΠΎΠ² Π“. М., Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // 2008.
  74. А.О. ВСхнология извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΎΠ² ВСкст] / Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π‘ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ. БистСмный Π°Π½Π°Π»ΠΈΠ·. ΠœΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅. 2009. — N5 3 (23).- Π‘. 97−102.
  75. И.Π’. ЭвристичСский ΠΌΠ΅Ρ‚ΠΎΠ΄ обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ† Π² Ρ€Π°Π·Π½ΠΎΡ„ΠΎΡ€ΠΌΠ°Ρ‚Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… ВСкст] / Π‘Ρ‹Ρ‡ΠΊΠΎΠ² И. Π’., Π ΡƒΠΆΠ½ΠΈΠΊΠΎΠ² Π“. М., Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π’Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ. 2009. — Π’. 14, № 2.- Π‘. 58−73.
  76. Shigarov А.О. A method for table detection in metafiles ВСкст] / Shigarov A.O., Bychkov I.V., Khmel’nov A.E., Ruzhnikov G.M. // Pattern Recognition and Image Analysis. 2009. — Vol. 19, No 4. P. 693−697.
  77. И.Π’. ΠœΠ΅Ρ‚ΠΎΠ΄ обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ† Π² ΠΌΠ΅Ρ‚Π°Ρ„Π°ΠΉΠ»Π°Ρ… ВСкст] / Π‘Ρ‹Ρ‡ΠΊΠΎΠ² И. Π’., Π ΡƒΠΆΠ½ΠΈΠΊΠΎΠ² Π“. М., Π₯ΠΌΠ΅Π»Ρ‹ΡŽΠ² А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π‘ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ. БистСмный Π°Π½Π°Π»ΠΈΠ·. ΠœΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅. 2008. — Π‘пСцвыпуск. — Π‘. 47−51.
  78. А.Π•. ΠœΠ΅Ρ‚ΠΎΠ΄ извлСчСния Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠ· Π½Π΅Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ тСкста ВСкст] / Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π’Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ. 2008. — Π’. 13, Π‘ΠΏΠ΅Ρ†. выпуск 1. — Π‘. 93−101.
  79. А.О. Автоматизированная систСма извлСчСния Ρ‚Π°Π±Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΠΌΠ΅Ρ‚Π°Ρ„Π°ΠΉΠ»ΠΎΠ² ВСкст] / Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π’Ρ€ΡƒΠ΄Ρ‹ XIV ВсСроссийской ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ «Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ ΠΈ ΠΌΠ°Ρ‚СматичСскиС Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π² Π½Π°ΡƒΠΊΠ΅ ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ». Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2009. — Π’. 2. — Π‘. 218−224.
  80. А.Π•. БСгмСнтация страницы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° для обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ† ВСкст] / Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π’Ρ€ΡƒΠ΄Ρ‹ XIII ВсСроссийской ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ ΠΈ ΠΌΠ°Ρ‚СматичСскиС Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π² Π½Π°ΡƒΠΊΠ΅ ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ. Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2008. — Π§. 2. — Π‘. 244−251.
  81. А.О. ΠœΠ΅Ρ‚ΠΎΠ΄ обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ† Π² ΠΌΠ΅Ρ‚Π°Ρ„Π°ΠΉΠ»Π°Ρ… ВСкст] / Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹ Π¨ΠΊΠΎΠ»Ρ‹-сСминара ΠΌΠΎΠ»ΠΎΠ΄Ρ‹Ρ… ΡƒΡ‡Π΅Π½Ρ‹Ρ… Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… эколого-экономичСских систСм. Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2008. — Π‘. 58−61.
  82. А.Π•. Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠ· Π½Π΅Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ тСкста ВСкст] / Π₯ΠΌΠ΅Π»Ρ‹ΡŽΠ² А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // Π”ΠΎΠΊΠ»Π°Π΄Ρ‹ 13-ΠΉ ВсСроссийской ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΈ ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ распознавания ΠΎΠ±Ρ€Π°Π·ΠΎΠ² (ММРО-13). Π—Π΅-лСногорск, 2007. — Π‘. 551−553.
  83. А.Π•. Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ статистичСских Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠ· Π½Π΅Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ тСкста ВСкст] / Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹ IX Π¨ΠΊΠΎΠ»Ρ‹-сСминара ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ. Π˜Ρ€ΠΊΡƒΡ‚ΡΠΊ, 2007. — Π‘. 167−169.
  84. И.Π’. Π‘Π²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎ ΠΎΠ± ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ рСгистрации ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹ для Π­Π’Πœ № 2 008 614 328 «ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ΅ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ срСдство обнаруТСния Ρ‚Π°Π±Π»ΠΈΡ† Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… (Tablocator)» / Π‘Ρ‹Ρ‡ΠΊΠΎΠ² И. Π’., Π ΡƒΠΆΠ½ΠΈΠΊΠΎΠ² Π“. М., Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // 2008.
  85. И.Π’. Π‘Π²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎ ΠΎΠ± ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ рСгистрации ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹ для Π­Π’Πœ № 2 008 614 332 «ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Π°Ρ систСма извлСчСния Ρ‚Π°Π±Π»ΠΈΡ† ΠΈΠ· ΡΠ»Π΅ΠΊΡ‚Ρ€ΠΎΠ½Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² (Tabextractor)» / Π‘Ρ‹Ρ‡ΠΊΠΎΠ² И. Π’., Π ΡƒΠΆΠ½ΠΈΠΊΠΎΠ² Π“. М., Π₯мСльнов А. Π•., Π¨ΠΈΠ³Π°Ρ€ΠΎΠ² А. О. // 2008.1. ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹
Π—Π°ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚ΠΎΠΉ