SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

投稿用戶 ? 2024年1月9日 am10:35 ? 科研百科 ? 閱讀 135

SPL是一種面向結(jié)構化數(shù)據(jù)計算的程序設計語言，集算器是SPL語言的Java實現(xiàn)，采用網(wǎng)格式編程形式提供了編碼和調(diào)試的IDE環(huán)境，語法比Java和SQL更為簡單易懂，開發(fā)效率更高。本文將從集算器的實現(xiàn)原理出發(fā)列舉一些可以提升計算性能的小技巧。

1數(shù)據(jù)類型

1.1 數(shù)值

SPL里的數(shù)值類型有Integer、Long、Double、BigDecimal。其中BigDecimal雖然能夠表示任意精度的數(shù)據(jù)，但計算速度比其它數(shù)類型慢很多，占用的內(nèi)存也大很多，因此在其它數(shù)字類型能夠滿足精度要求時，使用其它數(shù)類型代替BigDecimal能夠顯著提升計算效率。

實際案例中，在使用JDBC讀取數(shù)據(jù)庫數(shù)據(jù)時，有些數(shù)據(jù)庫的JDBC對于低精度數(shù)值也返回BigDecimal，這樣，在做性能優(yōu)化時就可以檢查一下是否可以轉(zhuǎn)為其它類型，從而提升性能。

1.2 字符串

Java的字符串對象String占用空間較大，一個長度為0的字符串占用40多個字節(jié)，而Integer、Long只占用16個字節(jié)。同時字符串的比較運算、哈希運算也比Integer、Long慢。

另外，數(shù)據(jù)從硬盤讀入生成java對象，其占用的內(nèi)存大小往往是其占用的硬盤大小的數(shù)倍甚至十倍以上（如果硬盤存儲使用了壓縮技術差距會更大）。這種情況可能直接導致不太大的數(shù)據(jù)文件在讀成java對象時發(fā)生內(nèi)存溢出，這時如果不能減少內(nèi)存占用量就只能使用外存計算了。而通常外存計算的復雜度遠大于內(nèi)存計算，同時也導致性能會下降很多。

那么，有沒有什么方法能夠減少內(nèi)存占用同時又能提高計算效率呢？

一個常用的方法就是枚舉串序號化，比如下面一個事實表的數(shù)據(jù)：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

性別、地區(qū)這類枚舉型的字段，可以建立一個對應表把性別、地區(qū)值轉(zhuǎn)換為序號1、2、…，這樣事實表中性別字段就可以只保存對應的序號，地區(qū)也是一樣。轉(zhuǎn)換后數(shù)據(jù)如下：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

這樣一來，我們就可以做到減少內(nèi)存占用，并且提高計算效率，因為數(shù)字的比較、分組等操作比字符串的要快很多。在輸出結(jié)果時，可以根據(jù)需要再把序號轉(zhuǎn)化為串，也就是使用序號直接按位置到代碼表中找到相應的記錄進行替換。

2序表結(jié)構

2.1 行追加

序表類似數(shù)據(jù)庫中的表，但是卻是有順序的。序表數(shù)據(jù)在內(nèi)存中用一個連續(xù)的數(shù)組保存。一般情況下，為序表分配內(nèi)存時會多預留一些空間來應付可能的增長，以免每次追加數(shù)據(jù)時都重新分配內(nèi)存，不過也不可能預留太多空間而浪費內(nèi)存。

基于這個原來，為序表頻繁地追加記錄，會導致這個數(shù)組長度不斷地變長，原先為這個數(shù)組分配的空間也要擴大。而擴大內(nèi)存分配不是一件很簡單的事情，需要分配一塊更大的空間，然后將原空間內(nèi)的數(shù)據(jù)復制過來。尋找空間和復制數(shù)據(jù)都要占用 CPU 時間，而且常常比運算本身的消耗都大。

因此，如果事先知道行數(shù)，一次性把序表創(chuàng)建出來，那只需要在一開始分配一次內(nèi)存就行了。即便序表中的字段值需要一些步驟才能計算出來，那也應該先new出序表后再去修改記錄的字段值，而不要計算一行插入一行。而對于修改記錄字段值的方法SPL提供了很多途徑。

假設我們想生成一個20行 2列的斐波那契數(shù)列序表，第一列key為行號，即 1,2,3,…；第二列 value 為值。斐波那契數(shù)列數(shù)列的規(guī)則是：第 1、第 2 行取值為 1，從第 3 行起，取值為前兩行之和。這個運算需要一步步實現(xiàn)，動態(tài)追加數(shù)據(jù)就是很自然的想法了：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

不過，序表一次性產(chǎn)生性能更好，即使計算本身仍然需要一步步實現(xiàn)：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

2.2 列追加

擴充序表，除了一行行追加數(shù)據(jù)，還有可能會改變數(shù)據(jù)的結(jié)構，增加每行數(shù)據(jù)中的字段，也就是所謂的列追加。列追加比行追加要更為復雜，序表本身是一個大數(shù)組，其中的每一行是一條記錄，物理實現(xiàn)上也是一個數(shù)組。因為數(shù)據(jù)結(jié)構很少改變，創(chuàng)建序表時不會在生成每行的數(shù)組時預留空間，否則內(nèi)存浪費就太多了（因為每一行都要預留）?；谶@種實現(xiàn)原理，如果出現(xiàn)列追加，就會發(fā)生前面說的重新分配空間的情況，而且要針對每一行記錄進行，再將原記錄數(shù)據(jù)抄過來，可以想見，這個動作的時間成本有多大，甚至經(jīng)常會遠遠超過追加那個列后要做的計算。

SPL為序表提供了追加列的功能，這會帶來方便性，但在關注性能時卻要慎用。不得不用時，也應該如上所述，一次性把需要追加的列都加上，不要一遍遍地追加。對于當時無法計算出字段值的列可以先填成空值，以后再用其它函數(shù)去修改字段值。

最常見的情況，從數(shù)據(jù)庫取出的序表后，如果事先知道要再derive出新的一列xxx，那么可以在寫SQL時多寫一個null as xxx，這樣在query時就直接把所需的字段都產(chǎn)生了，不用再做一次derive了。

例如，要從數(shù)據(jù)表sales中取出字段ORDERDATE,AMOUNT并按ORDERDATE排序，然后追加一列計算AMOUNT的累計值。一般先讀出再追加列的自然寫法：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

而用 SQL 語句先把列生成好的寫法：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

2.3 引用記錄

針對前面兩種調(diào)整序表結(jié)構的優(yōu)化思路，出發(fā)點都是減少new、derive函數(shù)中抄字段值的動作。除此之外，SPL還支持對象引用，字段取值可以是另一條記錄。這樣，在SPL中，大多數(shù)情況沒必要像SQL那樣在新結(jié)果集中把字段抄一遍，為了保持原有整條記錄一起參與運算，只要用引用方式來寫就可以了。這樣不僅性能更好而且空間占用也少。

上面用derive追加AMOUNT累計值的要求可以用new函數(shù)實現(xiàn)，new創(chuàng)建一個新序表，SRC字段引用原紀錄，CUMULATE字段存儲累計值，寫法如下：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

3循環(huán)函數(shù)

3.1 用循環(huán)函數(shù)代替循環(huán)語句

SPL的網(wǎng)格程序提供了循環(huán)語句for和分支語句if來實現(xiàn)復雜的運算邏輯。運行時，由于網(wǎng)格的執(zhí)行次序是動態(tài)解釋的，因此大量使用循環(huán)，會導致執(zhí)行的網(wǎng)格過多，在網(wǎng)格的動態(tài)解釋上就要花費大量的時間。

除了循環(huán)語句，SPL還提供了循環(huán)函數(shù)，可以對付大多數(shù)需要使用for語句的場景。對于計算步驟不太復雜，對性能要求高的運算應該盡量使用循環(huán)函數(shù)來完成。類似地，能用if 函數(shù)的場景也盡量不要用if語句。

1.2節(jié)中列舉的計算斐波那契數(shù)列的例子可以改寫為如下：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

其中#表示當前循環(huán)到哪條記錄，第一條記錄對應的#是1，依次遞增。value[-1]表示上一條記錄的value值，value[-2]表示上前數(shù)第二條記錄的value值。

eval函數(shù)每次執(zhí)行都要把參數(shù)指定的表達式字符串解析成表達式，然后再執(zhí)行，如果eval函數(shù)在循環(huán)里執(zhí)行，過多地把表達式字符串解析成表達式會花費大量的時間，如果表達式字符串不是變的則可以使用宏替換代替eval。

3.2 常量放在循環(huán)外

把循環(huán)里常量的產(chǎn)生放到循環(huán)外，也可以對性能優(yōu)化提供幫助。例如選出北京, 上海, 深圳地區(qū)的銷售記錄，比較“自然”的寫法是：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

因為SPL的序列是可以被修改的，所以表達式[\”北京\”,\”上海\”,\”深圳\”]每計算一次都會產(chǎn)生一個新序列。如果像上面這樣把[\”北京\”,\”上海\”,\”深圳\”]放在循環(huán)函數(shù)select里，那么在執(zhí)行時將會產(chǎn)生A2長度個序列。如果循環(huán)次數(shù)多，這些不必要的運算將消耗大量時間。因此，注重性能的寫法應該如下：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

3.3 警惕循環(huán)套循環(huán)

警惕循環(huán)函數(shù)中再有循環(huán)函數(shù)，這些代碼看起來很簡單，但幾層循環(huán)下來，實際計算量會以幾何級數(shù)放大。這雖然是個常識，但有時也會被忽略，因此能在循環(huán)外做的事不要放到循環(huán)內(nèi)。特別地，尤其要警惕在循環(huán)內(nèi)讀文件和訪問數(shù)據(jù)庫這種超級耗時的動作。

4代碼習慣

4.1 釋放內(nèi)存

Java在內(nèi)存不足時性能會急劇下降。所以要及時釋放內(nèi)存，SPL沒有刪除變量釋放內(nèi)存的語句，只需把變量或單元格的值設為空即可，也可以用clear語句清除一片格子。例子如下：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

以=開頭單元格是計算格，表達式的返回值會保存在單元格上，以>開頭的單元格是執(zhí)行格，表達式的返回值不會保存。cs.select和cs.join是給游標附加運算，不會產(chǎn)生新的游標所以返回值可以不用保存，A7格為釋放讀出的PART數(shù)據(jù)，也可以用clear語句把A1到A5之間的單元格值都清空，只需要把A7格代碼替換如下：

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

4.2 代碼緊湊

for 和if的代碼塊，可以直接寫到同一行上，沒有必要像Java那樣換一行再寫。SPL的網(wǎng)絡已經(jīng)能夠清晰地拆分出這些語句了。解釋器掃描空白格也需要時間，因此對于含有循環(huán)語句的程序，如果循環(huán)次數(shù)特別多，應該讓代碼緊湊一些，刪除空白的行和列以減少格子數(shù)量，從而提高解釋器的效率。

下面以獲取每天第一條銷售記錄為例，介紹一下SPL的代碼塊規(guī)則，sales是銷售記錄游標參數(shù)，按ORDERDATE有序。

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

單元格的代碼塊為單元格所在行及其正下和左下單元格都為空白格的行，上面例子中A2格for的代碼塊為[B2:F5]。B2格if的代碼塊為[C2 : F2]，if代碼塊的下一行和if所在格同列的單元格B3為else，并且B3左面的格子都是空白格，則B3格為B2格的else分支，B3格的代碼塊為[C3 : F5]。else也可以和對應的if同行，寫在if右面的單元格上。

贊 (0)

投稿用戶

一款支持低代碼能力的.NET Core數(shù)據(jù)可視化平臺來了（.net低代碼開發(fā)平臺）

上一篇 2024年1月9日 am10:27

云表：【建議收藏】什么是低代碼？一分鐘掌握低代碼開發(fā)（低代碼啥意思）

下一篇 2024年1月9日 am10:43

科研百科

大學生科研項目申請理由自我介紹（大學生科研項目申請理由怎么寫）

撰寫科研課題申報書，課題設計論證是重點課題設計論證包含的內(nèi)容課題名稱選好題是做好課題設計論證的重要前提和基礎，甚至可以說是關乎課題能否獲得評審者青睞的關鍵要素。課題名稱應明確…

2022年4月29日
360 0
木壘鎮(zhèn)西河社區(qū)：打造“黨建+”特色服務品牌提升小區(qū)網(wǎng)格服務效能

中新網(wǎng)新疆新聞6月21日電（羅婷）木壘鎮(zhèn)西河社區(qū)以“五個好”標準化規(guī)范化黨支部創(chuàng)建工作為契機，圍繞“黨建引領基層社會治理”主題，創(chuàng)建“一網(wǎng)格一特色，一支部一亮點”工作機制，在轄區(qū)五…

科研百科 2024年2月2日
121 0
一支部一項目一特色——國網(wǎng)天津電力深入開展“黨建載體再激活工程”

文_孫正龍?張廣松天津，是中國最早用電的城市之一，積累了豐富的電力工業(yè)遺產(chǎn)。1950年，毛澤東主席親筆復信，勉勵天津電力工人“團結(jié)一致，努力工作，為完成國家的任務和改善自己的生活…

科研百科 2023年6月21日
314 0
團隊項目管理工具

團隊項目管理工具隨著現(xiàn)代組織越來越依賴于數(shù)字化工具來管理項目，團隊項目管理工具成為了項目管理中不可或缺的一部分。這些工具可以幫助團隊成員更好地協(xié)作，提高項目效率，減少錯誤和延誤，…

科研百科 2024年5月24日
105 0
“三聚焦”不斷提升黨建工作質(zhì)量水平（持續(xù)提升黨建工作質(zhì)量）

近些年來，黑龍江省五大連池市為提升機關黨建工作質(zhì)效，精心打造理論課堂、情景課堂、專題課堂和實踐課堂，引導黨員學理論提能力、轉(zhuǎn)作風抓落實，不斷提升機關黨組織服務群眾本領。強國必先強…

科研百科 2024年7月3日
66 0
最新2022年PMP項目管理考試官方具體時間安排

PMP每年有4次考試，分別在3月，6月，9月和12月，最近的一次考試是2022年6月25日和2022年7月30日舉辦的考試。除北京和上海地區(qū)外，是在2022年6月25日上午舉辦的…

科研百科 2023年10月29日
155 0
婁勤儉：牢牢把握新時代基層黨建要求高質(zhì)量推進基層黨的組織建設

日前，省委書記婁勤儉在鎮(zhèn)江調(diào)研基層黨建工作。他強調(diào)，要深入學習貫徹習近平新時代中國特色社會主義思想，堅持用黨的最新理論成果武裝頭腦、指導實踐、推動工作，牢牢把握新時代基層黨建的要求…

科研百科 2023年6月29日
176 0
科研項目里承擔責任怎么填科研項目里承擔責任怎么填

科研項目中承擔責任的填寫在科研項目中，承擔責任是一個非常重要的環(huán)節(jié)。當項目結(jié)束時，需要對項目的貢獻進行評估，并為這些貢獻承擔責任。以下是一些關于如何填寫科研項目中承擔責任的指南：…

科研百科 2024年9月9日
30 0
開源工作流軟件

開源工作流軟件開源工作流軟件近日,中南財經(jīng)政法大學舉行了一項關于企業(yè)的公開招聘活動。本次面試中的工作人員用于求職機的圖片、視頻、數(shù)據(jù)等。招生要求本次考核主要考生掌握多少個人事崗位…

科研百科 2024年11月22日
0 0
智慧黨建綜合管理系統(tǒng)，打造互聯(lián)網(wǎng)黨建新模式，注入新活力（智慧黨建綜合管理平臺）

隨著信息技術的迅速發(fā)展，智慧黨建綜合管理系統(tǒng)應運而生，為黨建工作注入了新的活力。智慧黨建綜合管理系統(tǒng)以其高效、便捷的特點，打造了互聯(lián)網(wǎng) 黨建的全新模式，為推進黨的事業(yè)發(fā)展提供了強…

科研百科 2023年11月7日
177 0

SPL 代碼優(yōu)化技巧（pso優(yōu)化lstm代碼）

1數(shù)據(jù)類型

2序表結(jié)構

3循環(huán)函數(shù)

4代碼習慣

相關推薦