在單點捕捉模式下, 您只需要指定需要捕捉的點(螢幕坐標系),
GetWord每次捕捉時返回兩項內容:
1. 給定捕捉點處所在行的完整字串
2. 給定點所在處字元在整個字串中的索引位置(zero-based)
比如,您想捕捉滑鼠所在處的文字。假設螢幕上顯示的文字是:"Many people use Google to search
things. Google is a great searching engine."
如果您把滑鼠指標放在第二個Google的第一個'o'字元上, GetWord將返回:
1. 整個字串: Many people use Google to search things. Google is a great
searching engine.
2. 滑鼠所在處字元在整個字串中的索引位置: 42
在我們的實例程式(您可以在這裏找到示例程式,http://www.textcapture.com),
上述兩項內容分別為標記為'All Text' 和'Cursor Pos' . 滑鼠所在出文字是根據上述兩項內容計算獲得的.
一般來講,如果您想返回給定點處的完整單詞,比如,對於Google這個單詞,如果希望不論滑鼠指標放在其中哪個字元上,都返回完整單詞Google,一般需要
一個字典,根據字典中的內容決定返回什麼單詞。對於某些簡單的情形,可以不用字典而利用正則運算式來確定應該返回什麼單詞.
為了方便您的使用, GetWord SDK中提供了一個基於正則運算式的例子, 該例子位於GetWord SDK安裝目錄中的Sample\PlugIn_Demo\Token目錄下.
在區域捕捉模式下, 您需要指定要捕捉的視窗控制碼和捕捉區域(rectangle),GetWord將返回該區域內的所有文字.
有兩個GetWord API函數支援區域捕捉:
GetRectString和GetRectStringPairs.
GetRectString使用GetWord內置的文本格式化器輸出該區域內的所有文本。如果您想自己控制文本的輸出格式(排版),或者監視某個特定子區域內的特定字串,可以利用GetRectStringPairs函數. GetRectStringPairs返回給定區域內的所有子串以及每個字串對應的矩形位置,您可以根據每個子串的矩形位置,自己來控制輸出文本的編排格式.
在選擇捕捉模式下, 您需要指定要捕捉的視窗控制碼,用滑鼠選擇要捕捉的文字後,GetWord將返回選擇的所有文字.
3. PDF文字捕捉
為了支援PDF文字捕捉,您需要把GetWord庫檔中的`GetWord.api' 檔拷貝到Adobe Acrobat或Acrobat
Reader的plug_ins目錄下。假設Acrobat 7.0安裝在C盤, 則plug_ins目錄應該是"C:\Program
Files\Adobe\Acrobat 7.0\Acrobat\plug_ins".
PDF文字捕捉僅在捕捉區域內的文字在Acrobat或Acrobat
Reader中可以選中(捕捉時不需要真正選中捕捉區域內的文字)的情況下才能正常工作. 如果要捕捉的文字在Acrobat或Acrobat
Reader中不能選中,比如對於某些加密的PDF頁面和互動式的PDF頁面,GetWord不能正確完成捕捉.
4. 在Windows Vista運行GetWord用戶端程式
在Windows Vista系統中,
您需要以管理員身份運行您的GetWord用戶端程式。(Pic.3),請參考如下步驟:
1. 用滑鼠右鍵單擊您的GetWord用戶端可執行程式(the main executable file).
2. 在彈出的功能表中選擇"Properties".
3. 選擇彈出對話方塊中的"Compatibility"標籤.
4. 選中"Run this program as an administrator"選項, 單擊"OK"按鈕.
實際上,
如果您不以管理員身份運行GetWord用戶端程式,對於絕大部分程式來講,仍可以正確對其抓詞。但對於那些以管理員身份運行的程式,如果不以管理員身份運行GetWord用戶端程式,將不能對這些程式進行抓詞。這是因為,Windows
Vista內置的保護機制禁止這樣的抓詞操作,在這種情況下,您必須以管理員身份運行GetWord用戶端程式.

Pic.3
|
|