<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>de.straba.us &#187; ocr</title>
	<atom:link href="http://de.straba.us/tag/ocr/feed/" rel="self" type="application/rss+xml" />
	<link>http://de.straba.us</link>
	<description>destrabauz thoughts</description>
	<lastBuildDate>Fri, 20 Jan 2012 13:55:32 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Google come OCR dei tuoi PDF</title>
		<link>http://de.straba.us/2008/11/03/google-come-ocr-dei-tuoi-pdf/</link>
		<comments>http://de.straba.us/2008/11/03/google-come-ocr-dei-tuoi-pdf/#comments</comments>
		<pubDate>Mon, 03 Nov 2008 16:41:46 +0000</pubDate>
		<dc:creator>napo</dc:creator>
				<category><![CDATA[google]]></category>
		<category><![CDATA[ocr]]></category>

		<guid isPermaLink="false">http://de.straba.us/?p=29</guid>
		<description><![CDATA[Dalla lettura di questo post http://www.labnol.org/software/convert-scanned-pdf-images-to-text-with-google-ocr/5158/ scopro che google e&#8217; dotato anche di un potente ocr sui documenti pdf. L&#8217;autore propone un piccolo hack: acquisire un documento con il proprio scanner e salvarlo in formato pdf archiviare il file creato su un sito web attendere che google passi ad indicizzare il file cercare il file [...]]]></description>
			<content:encoded><![CDATA[<p>Dalla lettura di questo post <a href="http://www.labnol.org/software/convert-scanned-pdf-images-to-text-with-google-ocr/5158/"> http://www.labnol.org/software/convert-scanned-pdf-images-to-text-with-google-ocr/5158/</a> scopro che google e&#8217; dotato anche di un potente ocr sui documenti pdf.<br />
L&#8217;autore propone un piccolo hack:</p>
<ul>
<li>acquisire un documento con il proprio scanner e salvarlo in formato pdf</li>
<li>archiviare il file creato su un sito web</li>
<li>attendere che google passi ad indicizzare il file</li>
<li> cercare il file attraverso una query su google nello stile<br />
<code>site:sitoweb.com filetype:pdf</code><br />
(dove sitoweb.com e&#8217; il server che ospita il file pdf copiato)</li>
<li>utilizzare la funzione &#8220;Vedi come HTML&#8221; di google</li>
</ul>
<p>&#8230; e il gioco e&#8217; fatto &#8230;</p>
<p>l&#8217;hack e&#8217; sicuramente carino, rimane il problema della sensibilita&#8217; dei dati raccolti nel documento inoltre esiste diverso software libero in grado di fare ocr.</p>
]]></content:encoded>
			<wfw:commentRss>http://de.straba.us/2008/11/03/google-come-ocr-dei-tuoi-pdf/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

