Импорт
Окно импорта:
Данное окно предназначено для импорта контента в проект программы. Оно состоит из окна "Источник" и пяти вкладок настроек импорта.
Источник
В данном окне можно увидеть список файлов к импорту и структуру будущих разделов и статей (если используется соответственный импорт). Все файлы вне категории попадают в категорию по-умолчанию, или, если это HTML файлы с разбивкой статей по h1/2/3 - в категории соответственно правилам разбивки. В этом окне есть 5 управляющих кнопок:
- Загрузка файла(ов) - выбор одного или нескольки файлов к импорту в проект. Максимальное количество файлов, которые можно одновременно загрузить с помощью этой кнопки ограничено со стороны ОС (если я не ошибаюсь, то не больше 255 файлов);
- Загрузка файлов с папки - Аналогично первому, только вам необходимо указать папку в которой находятся все файлы к импорту. Ограничений на количество нету. Файлы будут добавлены в список в алфавитном порядке.
- Загрузка с сохранением структуры - Данный тип загрузки предназванен для импорта файлов с сохранением структуры папок. В результате получится, что папки в проекте будут категориями, а файлы что в них находятся - статьями этой категории. Необходимо указать папку, в которой находятся все файлы и папки, что будут участвовать в импорте.
Вкладка "Парсинг"
На этой вкладке находятся настройки импорта HTML файлов (сюда относится и импорт вордовских документов), TXT файлов, XML файлов, а так же параметры обрезки заголовков.
HTML:
- Очищать от тегов Word - нужна ли очистка от ненужных тегов которые расставляет Word. Рекомендуется отключать если не импортируете вордовский файлов, так как процедура очистки немного тормозит процесс импорта;
- Делить на рубрики и посты по тегам h1 и h2 - будет ли разбиваться файл на рубрики и посты в зависимости от наличия данных тегов в файле (если отключена, то один файл импорта = одному посту). Так же это относится к импорту файлов MS Word, где в роли h1 и h2 выступают форматы текста Заголовок 1 и Заголовок 2;
- Обрабатывать h3 – нужно ли делить на подкатегории по признаку тега h3;
- Формировать заголовки по... - Если не активны предыдущие 2 пункта, то файл импортируется как есть без разбивки, а потому название статьи для этого файла должны быть сформированы в соответствии с условиями этой опции.
TXT:
Здесь только опции формирования названия статьи, а так же опция отвечающая за активацию импорта в форумном формате. Импорт в форумном формате - это тип импорта с сохранением структуры, когда папки становятся категориями, а папки с файлами - постами с комментариями. Причем первый файл в такой папке - это стартующий текст (для форумов - это первый комментарий, для блогов - это текст статьи).
XML:
Выберите профиль импорта XML файлов. Профили можно настроить и добавить в "Файл - Импорт - Профили XML импорта". Детальнее об этом читайте в соответствующей статье.
SQL:
Выберите профиль импорта SQL файлов. Профили можно настроить и добавить в "Файл - Импорт - Профили SQL импорта". Детальнее об этом читайте в соответствующей статье.
Обрезать заголовок:
При активации этой опции длинные заголовки будут обрезаться в соответствии с указанными размерами, а в конце заголовка добавится указанная строка (в данном случае троеточие).
Вкладка "Пост обработка"
Настройка обработки контента после его импорта в программу. Тут у нас такие опции:
- Рубрика по умолчанию - Рубрика в которую будут попадать посты, в которых программа не может определить категорию (например при импорте текстовых файлов без сохранения структуры);
- Прописывать ALT картинкам - меню настройки автоматического формирования ALT картинкам, в которых он не прописан при импорте;
- Удалять все теги кроме указанных - удаляет все HTML теги кроме указанных в данном поле, разделитель пробел. Если поле оставить пустым, то теги удалятся не будут;
- Очищать атрибуты тегов - Очищает атрибуты тегов. Атрибуты тегов "a", "img", а так же указанных в соседнем поле не очищаются;
- Автозамена текста - Замена текста по указанным правилам.
Все эти параметры берутся с параметров указанных в настройках программы.
Вкладка "Автокатегории"
Данная вкладка служит для автоматического распределения постов по категориям. Распределение происходит релевантно в соответствии с указанными правилами. В поле "ключевое слово" записывается шаблон слова, при нахождении которого программа отнесёт статью к определённой категории, в поле "Категория" выбирается со списка существующая в проекте категория, в которую будет перенесена статья, или же записывается название новой категории.
Если в одной статье будут признаки нескольких категорий, то статья попадёт в категорию руководясь "Типом распределения."
Вкладка "Разбивка"
Эта вкладка одна из самых интересных в импорте. Прежде всего она не имеет аналогов внутри программы, и если вы не разбили статьи при импорте, то уже после импорта этого сделать не получится. Так что будьте внимательны.
Активируется функция разбивки при активации опции "Разбивать большие текстовые файлы". Если вы хотите, чтобы разбивались еще и HTML файлы, то нужно оставить активной опцию "Разбивать HTML файлы".
Статьи могут разбиваться по длине, т.е. ключевым аспектом выступает количество символов в статье, или по признаку (при нахождении которого программа знает что началась другая статья). С последним думаю всё ясно, потому рассмотрим первый случай:
- Размер статьи - количество символов, после которого программа начнёт искать место по которому обрезать;
- Минимальный файл - минимальный размер файла который программа будет пытаться разрезать. Определяется как результат умножения размера статьи на коэффициент. Так вот этот коэффициент нужно и указать.
- Обрезать по - признак обрезки статьи. Если, допустим, выбрали "Концу предложения", то программа отсчитает нужное количество символов указанное в первом параметре и начнём искать ближайший конец предложения, чтобы отметить конец этой статьи и начало следующей.
Для того, чтобы статьи имели хоть какие то название, используется функция автоназвания.
После обрезки статьи, программа начинает подбирать ей названия в зависимости от следующих опций:
- Случайное предложение - выбирается начало случайного предложения и подставляется в название статьи;
- Случайные слова - выбираются несколько случайных (подряд идущих) слов;
- Первая строка -выбирается первая строка;
- Список слов -выбирается одно с предложенных со списка ниже слов для названия статьи.

А есть возможность создавать категорию самому?
Есть:
импортируя с сохранением структуры или разбивая HTML файл тегами h1/2/3