關於我們
企業簡介
企業資質
企業文化
聯繫我們
誠聘英才
   新聞中心
公司新聞
產品資訊
所獲獎項
    產品中心
QCall
GetWord
典型案例
    產品訂購
產品購買
常見銷售問題
   技術支援
快速入門
下載試用
用戶回饋
常見技術問題
   招商加盟
代理商政策
加盟流程
 

您的位置:首  頁> GetWord > 開發者專區 > GetWord使用入門



註冊GetWord庫

GetWord庫在正式使用前必須先註冊. 在Windows Vista系統上請根據Pic.1Pic.2的指示註冊,在Windows 2000/XP/Server 2003系統上,可以直接運行register.bat註冊.

   

Pic.1

Pic.2

基本用法

1. 調用介面

GetWord支援兩種調用介面: ActiveX調用介面和Raw Dll調用介面.

ActiveX調用介面是推薦的介面調用方式。該調用方式非常簡潔,很容易集成到您已有應用系統中。ActiveX調用介面的代碼實例在GetWord SDK安裝目錄中的Samples\ActiveX_Demo.

Raw Dll調用介面不推薦使用,該介面僅僅是為了保持向後相容保留的. 如果您採用的開發環境不支援ActiveX調用介面(這樣的開發環境在現今已經很少見了), 您可以採用Raw Dll調用介面. Raw Dll調用介面的代碼實例在GetWord SDK安裝目錄中的Samples\Dll_Demo.

2. 文本捕捉模式

GetWord支援三種文本捕捉模式: 單點捕捉(Point Text Capturing)區域捕捉(Rectangle Text Capturing)選擇捕捉(Selection Text Capturing).

單點捕捉模式下, 您只需要指定需要捕捉的點(螢幕坐標系), GetWord每次捕捉時返回兩項內容:
1. 給定捕捉點處所在行的完整字串
2. 給定點所在處字元在整個字串中的索引位置(zero-based)

比如,您想捕捉滑鼠所在處的文字。假設螢幕上顯示的文字是:"Many people use Google to search things. Google is a great searching engine." 如果您把滑鼠指標放在第二個Google的第一個'o'字元上, GetWord將返回:
1. 整個字串: Many people use Google to search things. Google is a great searching engine.
2. 滑鼠所在處字元在整個字串中的索引位置: 42
 
在我們的實例程式(您可以在這裏找到示例程式,http://www.textcapture.com), 上述兩項內容分別為標記為'All Text' 和'Cursor Pos' . 滑鼠所在出文字是根據上述兩項內容計算獲得的.

一般來講,如果您想返回給定點處的完整單詞,比如,對於Google這個單詞,如果希望不論滑鼠指標放在其中哪個字元上,都返回完整單詞Google,一般需要 一個字典,根據字典中的內容決定返回什麼單詞。
對於某些簡單的情形,可以不用字典而利用正則運算式來確定應該返回什麼單詞. 為了方便您的使用, GetWord SDK中提供了一個基於正則運算式的例子, 該例子位於GetWord SDK安裝目錄中的Sample\PlugIn_Demo\Token目錄下.
 
區域捕捉模式下, 您需要指定要捕捉的視窗控制碼和捕捉區域(rectangle),GetWord將返回該區域內的所有文字.
 
有兩個GetWord API函數支援區域捕捉: GetRectString和GetRectStringPairs. GetRectString使用GetWord內置的文本格式化器輸出該區域內的所有文本。如果您想自己控制文本的輸出格式(排版),或者監視某個特定子區域內的特定字串,可以利用GetRectStringPairs函數. GetRectStringPairs返回給定區域內的所有子串以及每個字串對應的矩形位置,您可以根據每個子串的矩形位置,自己來控制輸出文本的編排格式.
 
選擇捕捉模式下, 您需要指定要捕捉的視窗控制碼,用滑鼠選擇要捕捉的文字後,GetWord將返回選擇的所有文字.
 
 
3. PDF文字捕捉

為了支援PDF文字捕捉,您需要把GetWord庫檔中的`GetWord.api' 檔拷貝到Adobe Acrobat或Acrobat Reader的plug_ins目錄下。假設Acrobat 7.0安裝在C盤, 則plug_ins目錄應該是"C:\Program Files\Adobe\Acrobat 7.0\Acrobat\plug_ins".

PDF文字捕捉僅在捕捉區域內的文字在Acrobat或Acrobat Reader中可以選中(捕捉時不需要真正選中捕捉區域內的文字)的情況下才能正常工作. 如果要捕捉的文字在Acrobat或Acrobat Reader中不能選中,比如對於某些加密的PDF頁面和互動式的PDF頁面,GetWord不能正確完成捕捉.

4. 在Windows Vista運行GetWord用戶端程式

在Windows Vista系統中, 您需要以管理員身份運行您的GetWord用戶端程式。(Pic.3),請參考如下步驟:
1. 用滑鼠右鍵單擊您的GetWord用戶端可執行程式(the main executable file).
2. 在彈出的功能表中選擇"Properties".
3. 選擇彈出對話方塊中的"Compatibility"標籤.
4. 選中"Run this program as an administrator"選項, 單擊"OK"按鈕.

實際上, 如果您不以管理員身份運行GetWord用戶端程式,對於絕大部分程式來講,仍可以正確對其抓詞。但對於那些以管理員身份運行的程式,如果不以管理員身份運行GetWord用戶端程式,將不能對這些程式進行抓詞。這是因為,Windows Vista內置的保護機制禁止這樣的抓詞操作,在這種情況下,您必須以管理員身份運行GetWord用戶端程式.

Pic.3

 

Copyright(c) 2006-2008 北京如令科技有限公司. All rights reserved. Terms of Use | Privacy Statement
ICP 06026970