Один из источников концепции Text Mining - контент-анализ. Понятие контент-анализа, корни которого уходят в психологию и
социологию, не имеет однозначного определения:
-Контент-анализ -
это методика объективного качественного и систематического изучения
содержания средств коммуникации - Д. Джери (J.J.
Jerry), Дж. Джери (J.Jerry).
-Контент-анализ -
это систематическая числовая обработка, оценка и интерпретация формы и
содержания информационного источника -Д. Мангейм (D.Mangeim), Р.
Рич (R.
Rich).
-Контент-анализ -
это качественно-количественный метод изучения документов, который
характеризуется объективностью выводов и строгостью процедуры и
заключается в квантифицированной обработке
текста с дальнейшей интерпретацией результатов (В. Иванов).
-Контент-анализ
состоит в нахождении в тексте определенных содержательных понятий (единиц
анализа), выявлении частоты их появления и соотношения с содержанием всего
документа (Б. Краснов).
Большинство
из приведенных определений конструктивны, но из-за различных начальных
посылок они порождают различные, а порой и противоречащие друг другу
алгоритмы.
Принято
разделять методологии контент-анализа на две
области: качественную и количественную. Основа количественного контент-анализа - частота появления в документах
определенных характеристик содержания (понятий, феноменов). Качественный
контент-анализ основан на самом факте
присутствия или отсутствия в тексте одной или нескольких характеристик
содержания.
Знаете ли Вы, что cогласно релятивистской мифологии "гравитационное линзирование - это физическое явление, связанное с отклонением лучей света в поле тяжести. Гравитационные линзы обясняют образование кратных изображений одного и того же астрономического объекта (квазаров, галактик), когда на луч зрения от источника к наблюдателю попадает другая галактика или скопление галактик (собственно линза). В некоторых изображениях происходит усиление яркости оригинального источника." (Релятивисты приводят примеры искажения изображений галактик в качестве подтверждения ОТО - воздействия гравитации на свет) При этом они забывают, что поле действия эффекта ОТО - это малые углы вблизи поверхности звезд, где на самом деле этот эффект не наблюдается (затменные двойные). Разница в шкалах явлений реального искажения изображений галактик и мифического отклонения вблизи звезд - 1011 раз. Приведу аналогию. Можно говорить о воздействии поверхностного натяжения на форму капель, но нельзя серьезно говорить о силе поверхностного натяжения, как о причине океанских приливов. Эфирная физика находит ответ на наблюдаемое явление искажения изображений галактик. Это результат нагрева эфира вблизи галактик, изменения его плотности и, следовательно, изменения скорости света на галактических расстояниях вследствие преломления света в эфире различной плотности. Подтверждением термической природы искажения изображений галактик является прямая связь этого искажения с радиоизлучением пространства, то есть эфира в этом месте, смещение спектра CMB (космическое микроволновое излучение) в данном направлении в высокочастотную область. Подробнее читайте в FAQ по эфирной физике.