Недавно пользователь попросил меня взять выписки по кредитной карте и преобразовать их в формат Excel. Они пытались передать его через мой преобразователь общих операторов, чтобы получить таблицу транзакций в формате excel, но синтаксический анализатор привел к пустой таблице.
В идеале конвертер выписок по кредитным картам, который я создал, должен сначала извлекать заголовки из выписок. После этого он пытается найти все записи, которые должны находиться под каждым заголовком.
Но эта выписка по кредитной карте отличается.
У него есть ряд проблем, которые мой общий анализатор банковских выписок не может преобразовать в формат Excel.
Делюсь отсканированной выпиской по кредитной карте в формате PDF, которая была преобразована в Excel, ниже.
Во-первых, у него нет заголовков.
Основная задача моего конвертера банковских выписок заключалась в том, чтобы сначала идентифицировать и найти заголовки в выписках. Заголовки должны содержать по крайней мере один заголовок даты, один заголовок описания или сведений и один заголовок дебета, кредита, баланса или суммы. Поскольку запись транзакции будет иметь минимум столбцов даты, описания и суммы, это поможет мне найти правильную таблицу транзакций в выписках по кредитным картам.
Во-вторых, у него несколько таблиц.
Алгоритм преобразования банковских выписок в Excel может получить только одну таблицу. Чтобы получить две таблицы в этой выписке по кредитной карте, мне пришлось изменить алгоритм.
Как найти транзакции в выписках по кредитным картам, если нет заголовков?
Поэтому вместо того, чтобы искать заголовки в выписке, я решил напрямую искать потенциальную запись транзакции. Для этого мне пришлось сделать предположение, что любая транзакция будет иметь связанный с ней столбец даты, и эта дата будет либо первой записью, либо второй записью. Это разумное предположение.
Это помогло мне идентифицировать строки транзакций в выписке по кредитной карте. Конечно, этого было недостаточно. Могут быть некоторые строки, которые могут содержать столбец даты, но не входят в таблицу транзакций.
Итак, второе, что я сделал, это попытался найти таблицу транзакций в выписке. Таблица транзакций будет иметь четкие границы, разделяющие ее столбцы даты, дебета, кредита, описания (и т. д.). Если я по ошибке включил в таблицу запись, не связанную с транзакцией, столбцы в других записях таблицы не будут четко выделять дату этой записи. И вообще, если да, то не проблема, мы можем включить его в таблицу с остальными правильно идентифицированными записями.
Как я определил две таблицы в данной выписке по кредитной карте?
Это было относительно просто определить. После извлечения всех потенциальных записей транзакций я сначала предположил бы, что оператор имеет только одну таблицу. Тогда я бы предположил, что в операторе всего две таблицы транзакций. Чтобы получить их правильное расположение в выписке, я бы сначала предположил, что первые две потенциальные записи транзакций принадлежат первой таблице. А остальные записи относятся ко второй таблице. Если мой алгоритм может найти четкие границы для всех транзакционных и нетранзакционных записей в обеих таблицах, это считается правильным разделением. Если нет, то первые три потенциальных записи транзакции считаются первой таблицей, а остальные записи принадлежат второй таблице. Этот процесс повторяется до тех пор, пока не будет найдена четкая граница для двух таблиц.
Конечно, процесс сложнее, чем то, что я описал выше. Но чтобы начать, вышеперечисленные шаги хороши.
Обновленный алгоритм теперь извлекает обе таблицы из выписки по кредитной карте и преобразует их в формат Excel.
Делимся окончательным результатом преобразования ниже:
Вдохновленный приведенным выше примером выписки по кредитной карте, я решил полностью удалить этап идентификации заголовков.
Вместо этого теперь алгоритм идентифицирует таблицы транзакций по столбцу «дата». В настоящее время поддерживается только обнаружение двух таблиц на одной странице выписки по кредитной карте. Если вам нужно извлечь более двух таблиц в выписках по кредитным картам, чтобы преуспеть, обратитесь по адресу shruti@convertpdfstatement.com.
Если вы не хотите программировать собственный анализатор выписок по кредитным картам, вы можете перейти на convertpdfstatement.com, чтобы быстро преобразовать выписки по кредитным картам в формат Excel. Парсер работает как для отсканированных, так и для несканированных документов. Для отсканированных документов он использует технологию OCR для получения текстовых данных из документа PDF-изображения.
Если вам нужен собственный анализатор для ваших отчетов, отправьте электронное письмо по адресу shruti@convertpdfstatement.com.
Часто задаваемые вопросы
Как преобразовать выписку по кредитной карте HDFC в Excel?
ваша выписка по кредитной карте HDFC может быть файлом PDF или файлом изображения. Чтобы преобразовать его в формат файла excel. Просто загрузите его в анализатор convertpdfstatement.com. Вы получите формат файла Excel / CSV за считанные секунды.
Можно ли преобразовать выписки по кредитной карте barclays в формат Excel?
Да, загрузите его на нашу платформу. Вы получите таблицу транзакций в формате Excel.
Как преобразовать выписку по кредитной карте в Excel
Воспользуйтесь нашей платформой convertpdfstatement.com, чтобы превратить выписку по кредитной карте в превосходную форму.
Как преобразовать выписку по кредитной карте в формат Excel без потери форматирования?
Легкий. Наша платформа не меняет форматирование. Он просто находит таблицу транзакций в формате PDF кредитной карты и преобразует ее в формат Excel. Вы не потеряете форматирование.
Как бесплатно преобразовать выписку по кредитной карте в формате PDF в Excel?
Парсер convertpdfstatement.com обеспечивает 20 конверсий в Excel бесплатно. Вы можете загрузить выписки по своей кредитной карте и получить таблицу Excel за считанные секунды.
Как преобразовать выписки по кредитной карте в формате pdf в формат Excel?
Возьмите выписку по кредитной карте в формате PDF и загрузите ее на convertpdfstatement.com. Вы быстро получите отчет о кредитоспособности Excel.
Можно ли отсканировать документ кредитной карты и преобразовать его в Excel?
Да. Отсканировав документ кредитной карты, перейдите на convertpdfstatement.com и загрузите его туда. Вы получите табличные данные в документе в формате Excel в кратчайшие сроки.
Как преобразовать финансовый отчет в формате PDF в формат Excel?
На нашей платформе выберите финансовый отчет, который вы хотите преобразовать. После завершения загрузки нажмите «конвертировать», и вы получите финансовый отчет в формате Excel.