行特征索引
RowFeatureIndex
维护行与其特征之间的映射。
这是一个不规则数据集,其中每行的特征数量和维度可能不同。
属性
名称 | 类型 | 描述 |
---|---|---|
_cumulative_sum_index |
数组
|
指示条目的指针 |
_feature_arr |
list[dict[str, ndarray]]
|
每个数据集的特征字典列表 |
_num_genes_per_row |
list[int]
|
跟踪每个数据集的特征长度(基因数量)的列表。 |
_labels |
list[str]
|
标签列表 |
_version |
数据集的版本 |
源代码位于 bionemo/scdl/index/row_feature_index.py
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 |
|
__init__()
实例化索引。
源代码位于 bionemo/scdl/index/row_feature_index.py
64 65 66 67 68 69 70 |
|
__len__()
长度是行数或 RowFeatureIndex 长度。
源代码位于 bionemo/scdl/index/row_feature_index.py
95 96 97 |
|
append_features(n_obs, features, num_genes, label=None)
使用给定的特征更新索引。
通过向行查找索引添加新跨度,将字典插入特征数组。 此外,我们更新新添加行的基因数量。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
n_obs
|
int
|
这些特征在其中出现的次数 |
必需 |
features
|
dict
|
对应的特征。 |
必需 |
num_genes
|
int
|
特征中每个特征键的特征长度(即,基因数量) |
必需 |
label
|
str
|
特征的标签。 |
无
|
源代码位于 bionemo/scdl/index/row_feature_index.py
99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 |
|
column_dims()
返回所有行中的列数。
返回
类型 | 描述 |
---|---|
list[int]
|
一个列表,其中包含每行中特征的长度 |
源代码位于 bionemo/scdl/index/row_feature_index.py
185 186 187 188 189 190 191 192 193 194 |
|
concat(other_row_index, fail_on_empty_index=True)
将其他 FeatureIndex 连接到此索引。
返回新的、更新的索引。 警告:就地修改此索引。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
other_row_index
|
RowFeatureIndex
|
另一个 RowFeatureIndex |
必需 |
fail_on_empty_index
|
bool
|
一个布尔标志,用于设置是否引发 |
True
|
返回
类型 | 描述 |
---|---|
RowFeatureIndex
|
self,连接后的 RowIndexFeature。 |
源代码位于 bionemo/scdl/index/row_feature_index.py
222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 |
|
load(datapath)
staticmethod
从数据路径加载数据。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
datapath
|
str
|
要加载的路径 |
必需 |
返回:RowFeatureIndex 的实例
源代码位于 bionemo/scdl/index/row_feature_index.py
273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 |
|
lookup(row, select_features=None)
查找给定行的特征。
假定该行是非零的。_cumulative_sum_index 包含指向哪些行对应于给定字典的指针。 为了获得特定行,我们确定它在 _cumulative_sum_index 中的位置,然后在 _feature_arr Args 中查找该字典:row (int):特征索引中的行。 select_features (list[str]):要选择的特征列表 返回 list[np.ndarray]:np 数组列表,其中包含指定特征的该行中的特征值 str:行的可选标签 Raises: IndexError:由于输入行是负数或超出索引中行的较大行而发生的错误。 如果索引中还没有条目,也会引发此错误。
源代码位于 bionemo/scdl/index/row_feature_index.py
128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 |
|
number_of_rows()
索引中的行数“”。
返回
类型 | 描述 |
---|---|
int
|
与索引中的行数相对应的整数 |
源代码位于 bionemo/scdl/index/row_feature_index.py
214 215 216 217 218 219 220 |
|
number_of_values()
获取数组中值的总数。
对于每一行,都计算基因数量。
返回
类型 | 描述 |
---|---|
list[int]
|
一个列表,其中包含每行块中特征的长度 |
源代码位于 bionemo/scdl/index/row_feature_index.py
196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 |
|
number_vars_at_row(row)
返回给定行中的变量数。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
row
|
int
|
特征索引中的行。 |
必需 |
返回
类型 | 描述 |
---|---|
int
|
该行特征的长度 |
源代码位于 bionemo/scdl/index/row_feature_index.py
174 175 176 177 178 179 180 181 182 183 |
|
save(datapath)
将 RowFeatureIndex 保存到给定路径。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
datapath
|
str
|
保存索引的路径 |
必需 |
源代码位于 bionemo/scdl/index/row_feature_index.py
256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 |
|
version()
返回版本号。
(遵循
源代码位于 bionemo/scdl/index/row_feature_index.py
88 89 90 91 92 93 |
|
are_dicts_equal(dict1, dict2)
比较两个具有字符串键和 numpy.ndarray 值的字典。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
dict1
|
dict[str, ndarray]
|
要比较的第一个字典。 |
必需 |
dict2
|
dict[str, ndarray]
|
要比较的第二个字典。 |
必需 |
返回
名称 | 类型 | 描述 |
---|---|---|
bool |
bool
|
如果字典具有相同的键并且所有对应的 numpy 数组都相等,则为 True;否则为 False。 |
源代码位于 bionemo/scdl/index/row_feature_index.py
31 32 33 34 35 36 37 38 39 40 41 42 |
|