VBAHaskell ユーティリティ群

先日の記事でVBAHaskellに数学関数を入れ始めたが、案の定その後が続かず放置状態になっている。とりあえず気にせずにユーティリティ関数群を追加する事にした。既存の関数のシンタックス・シュガーや特定の集計作業を便利にするための関数の寄せ集めだ。（適宜機能を追加していく）

シンタックス・シュガーとはいえ、3つ以上の引数を持つものを2変数にして、
mapF や zipWith、fold/scan 系の関数で使えるようになった ものもある。
モジュール名は「misc_utility」で、GithubおよびHPにある。

関数/Sub	機能	備考
p__n	getNth_b(, n)の構文糖	関数オブジェクトのみ
p_typename	データ型名	関数オブジェクトのみ
p_p_format	Format関数	関数オブジェクトのみ
p_InStr	InStr関数	関数オブジェクトのみ
p_InStrRev	InStrRev関数	関数オブジェクトのみ
p_foldl1	1次元配列のfoldl1	関数オブジェクトのみ
p_foldr1	1次元配列のfoldr1	関数オブジェクトのみ
p_scanl1	1次元配列のscanl1	関数オブジェクトのみ
p_scanr1	1次元配列のscanr1	関数オブジェクトのみ
subM_R	subM(m, 行範囲) の構文糖	p_subM_R を提供
subM_R_b	LBound基準のsubM_R	p_subM_R_b を提供
subM_C	subM(m, , 列範囲) の構文糖	p_subM_C を提供
subM_C_b	LBound基準のsubM_C	p_subM_C_b を提供
selectRow_b	LBound基準のselectRow	p_selectRow_b を提供
selectCol_b	LBound基準のselectCol	p_selectCol_b を提供
(Sub) fillRow_b	LBound基準のfillRow
fillRow_b_move	LBound基準のfillRow_move
(Sub) fillCol_b	LBound基準のfillCol
fillCol_b_move	LBound基準のfillCol_move
-	-	-
adjacent_op	隣接する要素間で2項操作	p_adjacent_op を提供
(Sub) rowWise_change	2次元配列の行ごとに関数適用
rowWise_change_move	2次元配列の行ごとに関数適用	rowWise_change 後に move して返す
(Sub) columnWise_change	2次元配列の列ごとに関数適用
colomnWise_change_move	2次元配列の列ごとに関数適用	columnWise_change 後に move して返す
equal_all	全要素の等値比較	p_equal_all を提供
equal_all_pred	全要素の等値比較（述語版）
-	-	-
splitStr2Funs	文字列を区切って関数列へマッピング
str2SummaryFun	文字列から集計関数へ変換	group_by_partition_pointsで使用
str2ConvertFun	文字列から型変換関数へ変換
group_by_partition_points	配列のGROUP BY集計	partition_point による

p_foldl1 は、本来の foldl1 に対する関数オブジェクトではない。
foldl1は引数を3つ持つので VBAHaskell の関数オブジェクトにすることはできない。3つ目の引数はどの次元を畳み込みの軸にするかを指定している。ここでは2引数の foldl1_v という関数を実装し、それに対する関数オブジェクトとして定義している。畳み込みの軸は指定できないので1次元配列に対象が限定されるが、通常はこれで十分だと思う。
subM_R と subM_C も同様に用途を行・列に限定することで関数オブジェクトにできるようにした（p_subM_R、p_subM_C）。

adjacent_op は今までなかったタイプの関数で、隣り合うペアを関数の引数にした結果を並べる。n個の要素を持つ配列であればn-1個の要素を持つ配列が出力される。

colomnWise_change_move は2次元配列の列ごとに関数を適用して変更するもので、たとえば特定の列をString型から整数型に変換するなどに使える。
その際、適用関数の列を作らなければならないが、それをサポートするのが文字列を区切って関数列へマッピングする splitStr2Funs だ。これを使ってC言語のprintfのように"%d%d%s"といった指定が可能になる。

group_by_partition_points は GROUP BY 的な集計作業をするものだ。SQLの GROUP BY はグループを分けるカラムを決め、それ以外の集計対象カラムに対する集計方法（SUMとか）を指定する機能を持っていると思う。この関数はグループ分けをする機能は持っておらず、グループの切れ目の位置は引数で与える必要がある代わりに、全部の列が集計対象カラムになる。切れ目の位置は、Haskell_5_sortモジュールにある partition_points（またはpartition_points_pred）関数などで作ることを想定している。

' 30行6列の配列を作る（値はランダム整数）
m = makeM(30, 6, uniform_int_dist(30*6,1,8))
' 昇順ソートしておく
m = subM(m, sortIndex(m))
' 最初の列でグループ分けしたときの切れ目の位置をを求める
pp = partition_points(selectCol(m, 0))
' その切れ目でグループ分けして集計（先頭、サンプル数、SUM, Average, MIN, MAX）
g = group_by_partition_points(m, pp, "%t%c%s%a%min%max")

どういう集計をするかは3番目の変数に文字列で指定するようにした。
「% + 特定文字」が集計方法を表し、たとえば %s とか %sum が合計値といった感じだ。

集計方法	文字列
先頭の値	%t %tp %top
末尾の値	%b %btm %bottom
個数	%c %cnt %count
合計	%s %sum %計
平均	%a %avg %average
最大	%max
最少	%min

この指定には上記 splitStr2Funs を使っているが、自分で変換関数を定義することによってもカスタマイズできる。

GithubのUtilityモジュール
 HPのUtilityモジュール