Wednesday, April 28, 2010

உபுண்டுவில் pdf to text

புண்டுவில் pdf கோப்புகளை text கோப்புகளாக மாற்ற முடியும். இதற்கு

system->administration->synaptic package manager சென்று அதன் search பெட்டியில் pdftotext என்று உள்ளீடு செய்தால் நமக்கு poppler-utils என்ற நிரல் வரும். அதை தேர்வு செய்து நிறுவிக்கொள்ளவேண்டும்.


இதனை செயல்படுத்த டெர்மினலில்

pdftotext xxx.pdf xxx.txt என்று தட்டச்சு செய்யவேண்டும். நமக்கு தேவையான கோப்பின் பெயர் கொடுக்கவேண்டும்.


மேலே உள்ள படத்தில் ஒரு pdf கோப்பு text கோப்பாக மாற்றியப்பின் எப்படி இருக்கும் என காட்டுகிறது. இப்போது கோப்பினை திறந்து பார்க்கலாம்.

ஒரு pdf கோப்பு

text கோப்பாக மாற்றியப்பின்



இதில் மேலும் சில கட்டளைகள்

pdftotext -l 4 xxx.pdf xxx.txt என்று கட்டளையிட்டால் கடைசி நான்கு பக்கங்கள் மட்டும் text கோப்பாக மாற்றும்.

pdftotext -f 3 xxx.pdf xxx.txt என்று கட்டளையிட்டால் முதல் மூன்று பக்கங்கள் மட்டும் text கோப்பாக மாற்றும்.

இந்த பக்கங்களின் எண்ணிக்கையை நம் விருப்பம் போல் மாற்றிக்கொள்ளலாம்.


pdftotext -upw 'password' xxx.pdf xxx.txt என்று கட்டளை கொடுத்தால் கடவுச்சொல் உடைய pdf கோப்பினை மாற்றலாம்.

2 comments:

வடுவூர் குமார் said...

சின்னச்சின்ன கட்டளைகளில் அற்புதங்களை இலவசமாக கொடுப்பது தான் லினக்ஸின் ஆச்சரியம்.இப்படியெல்லாம் இருக்கிறது என்று கூட தெரியாமல் பல நிறுவனங்கள் காசை அள்ளிக்கொட்டுகின்றன.

arulmozhi r said...

// வடுவூர் குமார் said...

சின்னச்சின்ன கட்டளைகளில் அற்புதங்களை இலவசமாக கொடுப்பது தான் லினக்ஸின் ஆச்சரியம்.இப்படியெல்லாம் இருக்கிறது என்று கூட தெரியாமல் பல நிறுவனங்கள் காசை அள்ளிக்கொட்டுகின்றன.//

வாருங்கள் வடுவூர் குமார். லினஸில் இன்னும் எத்தனையோ கட்டளைகள் உள்ளன. நீங்கள் சொல்வது உண்மைதான், பல நிறுவனங்கள் காசை மட்டும் அள்ளிக்கொட்டவில்லை. சொந்த செலவில் சூனியம் வைத்துகொண்ட கதையாகிவிட்டது