您現在的位置是:首頁 > 攝影首頁攝影
醫學資料科研——資料手動錄入
如何將一行資料同時補正0.05
編輯導語:如今隨著科技的發展,醫院裡的很多種方式都使用網際網路系統的方式進行,比如病人病歷的記錄,以前用本子,現在用資料庫,查詢起來比較方便;本文作者分享了關於醫學資料科研中的資料手動錄入,我們一起來了解一下。
一、背景
三甲醫院由於其具備頂尖的醫療資源,會吸引疑難雜症的患者前去就診,該部分患者所患疾病多為稀缺疾病,專病科研資料庫由於疾病的稀缺性所以資料庫內資料量較少。
在某疾病方向上,截止到2019年全國共有1516家三甲醫院,現階段約有600W份病例,每年仍將以30萬的速度增長。
對於醫院而言,這些資料為本院的醫學科研提供了資料基礎。
醫學科研,一方面可以提升本院的治療水平,進而提高本院患者治癒率;另一方面可以增加本院的醫學論文數量。透過醫學科研,可以提升醫院在該疾病領域的業界地位,提升競爭力,吸引更多的患者前來治療,最終為本院創造更多營收。
但是由於歷史原因,目前600W份的病歷資料依然是紙質資料。
在資料搜尋方面,紙質形式儲存的資料,需要人工翻閱紙質病歷查詢。當資料量小的時候,資料量查詢成本較高,但是人力尚可企及。當資料量大的時候,資料查詢幾乎成為不可能。
電子化儲存的資料,資料查詢效率縮短至秒級。
在資料統計方面,紙質形式儲存的資料,一次只能被一個人查閱,並且容易損壞;電子化儲存的資料支援多人同時檢視,並且不容易損壞。
電子資料為科研提供了便利。所以需要將紙質的病歷資料轉化成電子的病歷資料。資料手動錄入是將資料轉換成電子化的一個方法。
二、資料手動錄入
指,由人工將讀取到的資料,填入視覺化的頁面中,並將資料儲存至資料庫,將資料轉換成電子資料的方法。
包括自定義表單生成器和錄入資料兩個部分:
1。 自定義表單生成器
由於每個科研的研究方向不同,科研所需要的資料不同,採集資料的電子表單也將不同。
如果每個電子表單都由開發人員手動開發,隨著研究課題的數量增加,隨之增加的是人工成本、時間成本,降低專案交付的效率,自定義表單生成器是解決該問題的一款工具。
自定義表單生成器,是一款使用者可以根據自己需要自定義電子表單的工具。將生成電子表單的工作由技術人員轉移至現場專案人員,甚至有可能將工具的使用方法教給客戶使用。大大減低了企業生產電子表單的成本。
以表單“手術情況”為例,演示表單配置的過程,包括三步——第一步:建立表單;第二步:配置表單變數;第三步:選擇控制元件並配置控制元件屬性。
第一步:建立表單
建立表單時,需要根據表單所代表的業務含義設定“表單名稱”為“手術情況”。
“表單名稱”是表單的中文名稱,命名方式一般是表單的中文名稱,代表該表單的業務方向;具有可讀性,不具備唯一性,主要用於使用者在填寫或查看錶單時快速瞭解該表單的內容。
第二步:配置表單變數及變數控制元件屬性。
假設“手術情況”表單有4個欄位,手術執行時間、手術方式、麻醉方式、手術經過。以手術執行時間舉例說明,配置表單的過程。
配置欄位的變數名稱:手術執行時間;設定欄位的變數ID:operate_data。
“變數名稱”是變數的中文名稱,具備可讀性,不具備唯一性,主要用於使用者在填寫資料時快速瞭解該變數的含義。命名方式一般是變數的中文名稱。
“變數ID”是變數的英文名稱,具備唯一性,可讀性較差。主要用於系統識別字段。命名方式一般是變數的英文名稱。
第三步:選擇控制元件並配置控制元件屬性
為變數“手術執行時間”設定日期型控制元件。並配置控制元件的屬性,不同的控制元件需要配置不同的控制元件屬性。日期型控制元件關鍵屬性包括日期型別。
“控制元件型別”指的是該變數適合使用的控制元件展示。該控制元件用於使用者在前端頁面準確且快速的錄入資料庫需要儲存的資料。
“日期型別”指的是日期的精確度。有三種日期型別,年月日、年月日時分、年月日時分秒。
透過上述的配置過程,可以抽象出來表單配置的三個步驟:
建立表單:
根據業務情況,設定表單名稱和表單ID。
建立變數:
為該表單建立變數,設定變數名稱和變數ID。
選擇控制元件:
為變數設定合適的控制元件,並填寫控制元件的相關屬性,不同型別的控制元件,需要配置不同的屬性。
透過上述步驟完成其餘變數的配置,完成整張表單“手術情況”的配置,最終前端頁面效果如下圖:
2。 自定義表單釋出上線
配置完畢表單以後,表單處於一種草稿狀態。而科研資料由於其科研的嚴謹性,科研資料無法經常變化,需要建立在一種相對確定的資料結構上。所以需要把配置完成的表單釋出上線。
在系統首次部署時,釋出成功以後,所有資料直接使用該表單錄入資料。
系統在執行過程中,隨著系統的使用,使用者對錶單的需求存在發生變動的可能性。此時,需要對線上表單重新編輯,然後釋出上線。
由於歷史資料擁有很高的研究價值,需要根據新的表單將歷史資料進行清洗,以保證舊資料在新的表單結構下可以被使用。
3。 建立患者並錄入資料
錄入資料指的是,使用者在前端頁面以電子表單的形式將紙質資料錄入到系統中,形成電子化的過程。由兩個步驟組成,建立患者、錄入患者資料。
1)建立患者
指,在系統中增加一個新的患者。將新增患者的操作由使用者直接在頁面上完成,使得沒有程式設計能力的人也可以將資料插入到系統中,降低了使用者往資料庫中新增資料的操作成本。
對於建立患者所使用的欄位,不同病種資料庫,因為資料質量不一致和對資料安全要求不同,所以在建立患者時填寫的欄位也不相同。所以需要配置建立患者所使用的變數。
對於患者唯一標示,建立患者時,系統會自動生成患者唯一標識。但是為了再次建立患者時,能夠識別出來患者是否存在。所以需要根據建立患者時使用的欄位生成患者ID。如果患者ID的生成規則發生變化,需要對歷史資料進行清洗。
2)錄入資料
指,在系統中完善患者資訊。使用者在前端頁面以電子表單的形式,完善患者資訊。使得沒有程式設計能力的人也可以將資料插入到系統中,降低了使用者往資料庫中錄入資料的操作成本。
科研所需的資料質量高,只有經過稽核,確認資料達到使用要求,才可以被科研所使用。需要對錶單資料設定狀態來表示資料是否可用,包括暫存、提交待稽核、稽核透過、稽核駁回等。
手動錄入的資料量較大,需要提高資料錄入的效率。例如在設計表單時將資料分組分類;透過鍵盤快捷鍵快速切換變數;快速切換到下一頁等快捷操作。
三、總結
紙質資料透過手動錄入的方式進入資料庫,由於人腦在處理資料上更靈活性,資料填充率相比於系統填寫會比較高。但是資料錄入的效率會低效。
可以透過以下方式保持高效率和高填充率:將病歷分成不同模組,由專業的醫學人員對非專業的人員按病歷模組進行培訓,資料錄入的問題將轉換成如何管理資料錄入員的問題。
本文由 @申bobo 原創釋出於人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基於 CC0 協議