Вначале пользователь заводит нужные файлы в систему: указывает папку, в которой лежат файлы Excel, Гугл-таблицы и доступы к ней. Прописывает правило, по которому система найдет нужные имена файлов и листов внутри документа. После этого нужно составить
правила интерпретации ячеек.
Эти правила пишутся на специальном
языке CRL. Язык можно полностью выучить за час, зато потом сэкономить много часов на преобразованиях таблиц. Правила интерпретации ячеек описывают три вещи:
- как найти границы таблицы с нужными данными на листе;
- как определить класс, к которому относится ячейка. Она может содержать заголовок (в примере выше — слово «Акция»), метку («Январь», «Февраль», дни месяца и названия акций) и непосредственно данные (числа);
- соответствие между данными и метками (к какой акции и дате относится каждая ячейка с данными), между метками и категориями («Татьянин день» — это акция, 25 — это «Число», «Январь» — это месяц). Категории и метки можно брать из ячеек, либо задавать прямо в правиле.
После этого пользователь может настроить расписание, по которому tableCraft будет обращаться к папке, искать нужные файлы, извлекать оттуда данные в соответствии с правилами и складывать их в базу или хранилище на S3. Они будут отображаться в таком виде: