PDF > Site - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.2486
BTC/USD69232.2390
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 08.09.2014, 15:06
Start Post: PDF > Site 
  #11
Dumpty
Senior Member
 
Аватар для Dumpty
 
Регистрация: 08.05.2008
Сообщений: 834
Бабло: $258860
Отправить сообщение для Dumpty с помощью ICQ
Question

Всем привет.
Есть огромное кол-во пдфок. Вопрос: как загнать их все на сайт?
Ручками копипастить мега долго, прикинул что там почти 3 месяца работы, если работать по 22 дня в месяц по 8 часов

Что есть: пачка пдфок разложена по папкам.
Что надо: каким то образом их все загнать на сайт, программно. При этом крайне желательно сохранение форматирования. Т.е. нужен либо конвертер какой пдф в текст/хтмл, чтобы через хмлрпц загнать на сайт. Либо каким то образом их обрабатывать и запихивать текст... П.С. сайт на джумле

П.С. не особо секу в формате пдф, но руками копировать текст дает (контрл+а, контрл+с), поэтому видимо нет никакой ззащиты пдфок от копипаста.

Вобщем не понятно пока с какой стороны подойти. Посоветуйте решение, если кто сталкивался.
Dumpty вне форума  
Старый 12.09.2014, 15:44   #12
Dumpty
Senior Member
 
Аватар для Dumpty
 
Регистрация: 08.05.2008
Сообщений: 834
Бабло: $258860
ТС -->
Отправить сообщение для Dumpty с помощью ICQ
автор темы ТС По умолчанию

Всем спасибо

Цитата:
Сообщение от baadf00d Посмотреть сообщение
Попробуй это - https://cloudconvert.org/
Бесплатных качественных решений не встречал, хотя с этой темой связан.
Нашел софтину (правда платную) которая так же конвертирует... Вроде проскакивала бесплатная - но забыл название. У этого сервиса даже в хтмл коде прописано название софта (который они используют, но платный).

Вобщем перепробовал все, 2 дня убил, у всех ХТМЛ код очень грязный выходит, куча тегов не нужных, и слишком геморно их программно разбирать что куда. Ну и плюс проблема с таблицами у всех. Оформляется просто расположением отдельных букв/цифр по координатам через цсс.

Нашел решение одно, правда платное. Отлично конвертирует, таблицы идеально понимает, мало грязи. Вобщем - супер. Но сцуко тоже платное.
Если кому интересно - http://www.pdfonline.com/easyconverter/sdk/pdf-to-html/
Сделал к ним запрос цены, молчат пока. Может кто знает где скачать бесплатно эту штуку можно? Буду благодарен
Dumpty вне форума  
Старый 12.09.2014, 17:27   #13
Moonlight Cat
Senior Member
 
Аватар для Moonlight Cat
 
Регистрация: 10.09.2012
Сообщений: 1,217
Бабло: $211845
По умолчанию

Цитата:
Сообщение от Dumpty Посмотреть сообщение
ну мне надо не только сконвертировать (это первая часть проблемы), так как при конвертации теряется оформление. пробовал несколько конверторов, вообще не доволен был. поэтому и спрашиваю кто с чем работал и что мега хорошо конвертирует и сохраняет форматирование.
Была такая же проблема. Перепробывал несколько программ для конвертирования, то же терялось качество.

В итоге пошел по самому простому пути. На oDeske нанял индуса, который, вручную копировал из PDF файла статьи в ворд, форматировал их и присылал мне готовый .doc файл с отформатированным текстом.

Цена вопроса у меня было $4, за один PDF файл. Причем PDF файл представлял из себя типа журнала, где еще статьи были перемешаны картинками, в разных колонках и.т.д. Т.е. весьма муторно для копирования.

В последствии я еще чуть доплатил, чтобы он сразу статьи на сайт добавлял.
Moonlight Cat вне форума  
Старый 18.09.2014, 18:24   #14
Dumpty
Senior Member
 
Аватар для Dumpty
 
Регистрация: 08.05.2008
Сообщений: 834
Бабло: $258860
ТС -->
Отправить сообщение для Dumpty с помощью ICQ
автор темы ТС По умолчанию

Ответили отсюда http://www.pdfonline.com/easyconverter/sdk/pdf-to-html/
1к хотят за либу
Dumpty вне форума