文章编号:1671-4598(2024)09-0290-09 DOI:10.16526/j.cnki.11-4762/tp.2024.09.041 中图分类号:TP274 文献标识码:A

# 时分复用双光子成像系统高速数据处理研究

# 铭美林,贾豫东

(北京信息科技大学仪器科学与光电工程学院,北京 100192)

摘要:为满足高频脉冲时分复用的双独立扫描探测双光子显微成像系统中信号解多路复用、行场同步、像素值重建的需求, 对高速数据的采集处理进行了研究;基于 LabVIEW FPGA,结合有限状态机、FIFO缓存和并行流水线等技术,设计了一种多功 能采集处理系统,通过精确的时序控制,成功实现了高速数据的无损解复用和后续成像数据处理,并能够对共振振镜非线性运动 导致的图像畸变进行校正;经过调试仿真和实验测试表明,在系统单通道采样率 800 MSPS、200 MHz FPGA 处理时钟下,能够 对160 MHz 时间交错激光脉冲产生的来自不同位置的相应荧光信号进行复杂处理;经实际应用表明,系统满足实时成像的需求, 为相关领域的研究者提供了有益的参考。

关键词:时分复用;双光子显微成像系统;高速数据;解多路复用;像素值重建;图像畸变;LabVIEW FPGA

# Research on High-speed Data Processing of Time-division Multiplexing Two-photon Imaging System

## ZHANG Meilin, JIA Yudong

(School of Instrumentation Science and Opto-electronics Engineering, Beijing Information Science and

Technology University, Beijing 100192, China)

Abstract: In order to satisfy the needs of signal demultiplexing, line-field synchronization and pixel value reconstruction in the two-photon microscopy imaging system with high-frequency pulse time-division multiplexed and dual-independent scanning detection, the acquisition and processing of high-speed data are studied; Based on LabVIEW FPGA, combined with finite state machine, FIFO cache and parallel pipeline technologies, a multifunctional acquisition and processing system is designed, which successfully achieves the lossless demultiplexing of high-speed data and subsequent imaging data processing through the precise timing control, it can correct the image distortion caused by the nonlinear motion of the resonant galvanometer; After debugging, simulation and experimental testing, with single-channel sampling rates of 800 MSPS and 200 MHz FPGA clock, the system can perform complex processing on the corresponding fluorescence signals from different locations generated by 160 MHz time-staggered laser pulses. Practical applications show that the system meets the needs of real-time imaging and provides useful references for researchers in related fields.

**Keywords:** time division multiplexing; two-photon microscopy imaging system; high-speed data; demultiplexing; pixel value reconstruction; image distortion; LabVIEW FPGA

#### 0 引言

近年来,双光子荧光显微镜以其对样品的低损伤性、 强大的穿透能力、高分辨率等特点而被广泛应用于化学、 医药学和生命科学等研究领域<sup>[1-3]</sup>。在生命科学领域中,通 过捕捉细胞微观结构在运动过程中的动态信息,研究者们 可以更全面地了解生物的生理功能规律<sup>[4]</sup>,但生物细胞化 学反应过快,且需要同时监测多个区域以研究行为运动时 区域间的相互作用,例如动物大脑区域等运动<sup>[5]</sup>。因此, 提升系统的成像视野、成像通量等、成像深度等性能是当 下双光子显微成像系统研究中的热点<sup>[6-7]</sup>。目前提升成像视 野的方法主要有:多套独立激发扫描探测成像、大视野介 观物镜双焦点扫描成像、大孔径振镜多区域随机扫描成像; 提升成像通量的方法大多选用轴向多平面同步成像<sup>[8-10]</sup>,上述的方法都需要采用激光脉冲时分多路复用技术来实现。 成像技术的发展使得荧光信号的吞吐量增加<sup>[11]</sup>,信号处理 流程更为复杂<sup>[12]</sup>,尤其对于时分复用成像系统,信号解复 用的准确性和图像实时重建处理成为获得准确、清晰成像 结果的关键环节。

文献 [13] 双激发扫描探测成像系统中采用独立成分 分析 (ICA) 算法分离不同区域的荧光信号;文献 [14] 大 孔径振镜多区域随机扫描成像系统中信号解复用采用基于 射频开关的信号解复用电路,解复用后信号接入数字化仪 器;文献 [15] 双独立扫描探测显微镜系统中的解复用也 是在信号数字化之前进行,结合延迟盒和鉴频器完成解复 用后输入 vDAQ 数字化仪通道,两者都采用 ScanImage 商

引用格式:张美林,贾豫东.时分复用双光子成像系统高速数据处理研究[J].计算机测量与控制,2024,32(9):290-298,306.

收稿日期:2024-02-25; 修回日期:2023-04-01。

作者简介:张美林(1997-),女,硕士。

通讯作者:贾豫东(1975-),男,博士,教授。

业化软件进行后续图像重建; 文献 [16] 提出一种能够用 于光子计数、三维重建、解多路复用的多功能开源软件, 该软件运行在 PC上,高度依赖中央处理器和图形处理器, 当数据计算量大时不利于实时成像; 文献 [17] 多平面同 步成像系统中由 NI 数字化仪和 FPGA 模块组合读入模拟信 号后在 FPGA 端进行解多路复用,用定制的扫描图像软件 进行图像重组,该系统结构为单侧扫描探测成像,无法满 足时分复用双独立扫描探测成像系统。以上都能够在 80MHz 脉冲时分复用双光子显微成像系统下,完成不同区 域的荧光信号的拆分,但硬件电路实现解多路复用的装置 繁琐且不利于系统的迭代升级,而基于 FPGA 实现时分复 用双光子双独立扫描探测成像系统中信号处理的研究较少。

鉴上,本文针对脉冲时分复用双独立扫描探测双光子 显微成像系统中高速数据处理部分进行研究,采用 Lab-VIEW 编程,设计实现了基于 FPGA 的数据解复用,并能 够完成信号的行场同步、像素值重建、图像畸变校正等一 站式功能。

## 1 系统结构及原理

#### 1.1 时分复用双独立扫描探测双光子显微成像系统

时分复用双独立扫描探测双光子显微成像系统组成如 图1所示,由光路、显微成像、扫描控制、光电探测、数 据采集处理、上位机等模块组成。



图 1 时分复用双独立扫描探测双光子显微成像系统图

钛蓝宝石激光器产生波长为 920 nm, 频率为 80 MHz

的连续激光,通过偏振光学器件 (PBS) 将入射激光分为两 路,一路光通过扫描振镜后进入上侧显微镜,对组织样本 的一侧进行激发,另一束光经固定延迟 6.25 ns,以相同的 方式到达待测样品对侧激发,由于荧光在到达探测器之前 有不同程度的光衰减和光散射,这与 PMT 距离发光样本的 位置有关,因此系统设置了双侧的光电探测器 (PMT)进 行收集,上侧光电探测器(PMT\_CH1)和下侧光电探测 器 (PMT CH2) 都对两个不同区域的荧光信号交替收集。 两侧 PMT 将探测的荧光信号转换为电信号经跨阻放大器放 大后输入到采集处理系统;扫描控制系统根据两组振镜的 运动轨迹将两路激发路径的行同步信号(H\_SYNC\_ CH1、H\_SYNC\_CH2)和场同步信号(V\_SYNC\_ CH1、V SYNC CH2) 输入至数据采集卡; 数据解复用 的激光同步信号 (Laser SYNC) 由激光器同步输出脉冲 信号2分频输入至采集卡;同时,使用 AD9516 芯片生成与 Laser\_SYNC 锁相的 800MHz 采样时钟供采集系统使用; 成像参数以及解决图像畸变所需的非线性累加查找表由上 位机计算后发送至采集处理系统,系统对高速信号进行解 复用和后续成像数据处理,以像素为单位传输灰度值至上 位机进行图像重组显示。成像系统信号流程如图 2 所示, 经采集处理系统解多路复用后, CH1、CH2 通道数据流各 分解为两组,共4路数据流。至此,就可以通过一束激光 脉冲的时分复用和固定延迟实现对两个区域的同时成像, 在相同的时间分辨率下,成像视场能够翻倍。本文中将着 重介绍数据采集处理模块中的设计及实现过程。

#### 1.2 共振振镜图像畸变补偿原理

本系统中使用共振振镜一检流计式振镜组进行点扫描 成像,共振振镜负责图像 X 轴方向的扫描,完成一行扫描 后,检流计振镜在 Y 轴上移动一个步长。共振振镜为转速 较高的简谐运动,转动角速度呈正弦变化,在图像边缘的 角速度接近 0,而在中间时的速度最高。采集系统以固定采 样频率进行信号采集,单位像素值的重建过程中对多个采 样点进行累加平均处理,若对行内的每个像素以相同采样 点数重建,则重组后的整幅图像会出现两端呈拉伸形变, 中间呈压缩形变<sup>[18-19]</sup>。为解决图像畸变问题,通过分析共 振振镜速度的变化规律,采用样本等时间间隔采样结合像 素值反正弦过采样信号值重建的方法,在 FPGA 端完成非 线性累加平均的像素值重建,再发送至上位机处理,实时 输出校正后的图像。



图 2 成像系统信号流程图

700

在共振振镜的运动中,像素点的行方向位移量 X(t) 与 像素点采样时刻 t 之间的关系如下:

$$X_{(t)} = \frac{X_{\max}}{2} \left( 1 - \cos(\frac{2\pi t}{T}) \right)$$
(1)

其中: X<sub>max</sub> 为振镜扫描行方向最大位移量, T 为一次简 谐运动的周期。如果像素点在行扫描方向的位移相等, 那 么同一行中第 k 个像素点在扫描平面上的行位移 X<sub>(k)</sub> 可表 示为:

$$X_{(k)} = X_{\max} \cdot \frac{k}{N_m}$$
  $(k = 1, 2, 3, \dots, N_m)$  (2)

其中: N<sub>m</sub> 为图像行方向上的总像素点数。由公式(1) 和公式(2)可以得到均匀空间采样情况下,当前行第 k 个 像素的采集时刻 t(k),该时刻可用以下公式表示:

$$t(k) = \frac{T}{2\pi} \cdot \arccos\left(1 - \frac{2k}{N_m}\right) \tag{3}$$

那么相邻两个像素点的时间间隔为:

$$\triangle t(k) = \frac{T}{2\pi} \begin{bmatrix} \arccos\left(1 - \frac{2k}{N_m}\right) \\ -\arccos\left((1 - \frac{2(k-1)}{N_m}\right) \end{bmatrix}$$
(4)

采样系统的采样周期设为 $T_s$ ,那么第k个像素的采样 点总数 $S_k$ 为:

$$S_{k} = \frac{T}{2\pi \cdot T_{s}} \begin{bmatrix} \arccos\left(1 - \frac{2k}{N_{m}}\right) \\ -\arccos\left(1 - \frac{2(k-1)}{N_{m}}\right) \end{bmatrix}$$
(5)

在做采样点累加平均运算时,考虑到用 FPGA 硬件逻 辑实现除法运算会占用大量逻辑单元,由上位机计算每个 像素所需采样点个数,并取倒数得到每个采样点在所在像 素中的权值,将两组参数打包为查找表发送至与 FPGA 通 信的 FIFO中,FPGA 端读取 FIFO 后写入 ROM。以解复 用后一路信号对应 ADC 采样率为 400 M/s,振镜扫描频率 为7 910,像素分辨率为 512 \* 512,5 个采样点并行累加平 均为例,引用式 (5),计算得到的行像素点与其对应采样 点总数关系如图 3 (a) 所示、行像素点与其对应采样点权 重关系如图 3 (b) 所示。

#### 2 采集处理系统设计与实现

#### 2.1 采集处理系统总体设计

2.1.1 硬件选型

数据采集处理系统采用 NI 公司的高速数字化仪,由 NI-5772 高速采集卡和 PXIe-7961R FPGA 控制器组成。NI-5772 具有两个模拟输入通道,单通道采样速率可达 800 MSPS,采样精度为 12 bit,模数转换后,以4个顺序采样 点为一组数据流供 FPGA 端再次处理,数据宽度转为 16 bit,该采集卡的双通道能够满足双侧 PMT 的荧光信号采 集,并且其采样率能够满足单通道下整体频率为 160 MHz 的激光脉冲信号的拆分处理; PXIe-7961R FPGA 控制器所 使用的处理芯片为 Virtex-5 SX50T FPGA,该芯片由丰富 的逻辑块、内存块、I/O 块和时钟等资源组成,能够通过

0 50 100 150200 250 300 350 400 450 500 k/pixel (a) 行像素点与其对应采样点总数关系图 0.035 像素所占权重 0.030 0.025 0.020 9 0.015 東世 0.010 样 0.005 0 0 50 100 150 200 250 300 350 400 450 500 k/pixel (b) 行像素点与其对应采样点权重关系图

LabVIEW FPGA 模块设计数字电路<sup>[20]</sup>,无需使用硬件描述 语言就能够实现对高吞吐率数据的实时处理,使得开发变 得更高效。

此外,该 FPGA 模块还能配置 Configuration Engine 对 采样时钟进行设置,既能够通过输入外部基准时钟和内部 采样时钟锁相,又能够直接输入外部采样时钟同步两个或 多个模块。但外部基准时钟频率要求为 10 MHz+9 dBm, 而激光脉冲速率取决于谐振器,谐振器路径长度受环境温 度、湿度等影响较大<sup>[14]</sup>,以至于分频后的脉冲频率波动会 超出灵敏度范围,锁相会失败,所以本系统选用采样时钟 生成器生成频率为 800 MHz 的时钟信号。

2.1.2 模块化设计

单周期定时循环(SCTL)是一个主要的 LabVIEW FP-GA 结构,可降低资源占用,提供更高吞吐量和更精确的定时控制。在 SCTL 内具有最长传输延迟的数据路径称为关键路径,如果关键路径上的传输延迟超过 SCTL 时钟周期,编译就会失败。

FPGA 端对模数转换后的数字信号进行处理,使用频率 200 MHz 的时钟,这样能够保证未解复用前的信号的完整性,但由于数据的吞吐量大,且处理流程涉及到解复用、行场同步、累加平均、传输等过程,5 ns 的时钟分辨率过快,这一系列处理无法在 SCTL 下以串行的方式完成。

为了能够利用高频时钟对数字信号进行精确、无间断的解复用处理,设计将 FPGA 中的系统功能分为数据解复用、成像数据处理、时钟配置、参数接收四大模块,各模块并行工作,采集处理系统构成如图 4 所示。数据解复用



图 3 行像素点采样点总数及采样点所占权重图

模块与成像数据处理模块之间数据传输采用终端范围内的 先进先出(FIFO, first input first output)进行缓存,如此 而来,就可以满足无间断解复用的需求,两个模块各自配 合使用状态机、并行流水线等技术,缩短 SCTL 中的关键 路径,为高时钟分辨率下的复杂数据处理提供可能。

2.1.3 通信设计

对于较大量的数据传输,如本系统中的累加平均查找 表,重建后的像素灰度值等,都通过直接内存访问(DMA, direct memory access)的 FIFO 访问策略缓存数据,实现上 位机和 FPGA 终端间高吞吐量数据的高速缓存和稳定传输, 这种传输方式通过 PXIe 总线为 RAM 与 I/O 设备开辟了一 条直接传送数据的通路,提高了 CPU 的效率;对于小型参 数的传输,例如图像分辨率、成像控制信号等,为了节省 系统资源,采用读取/写入控件函数对 FPGA VI 前面板上 存在的输入、显示控件进行写入和读取。

#### 2.2 数据解复用设计实现

2.2.1 时序设计

在上文中阐述到,模数转换后4个顺序采样点为一组数

据流,也就是 5 ns 的采样点,经 FPGA 端 200 MHz 的时钟 再次采集处理;时分复用后激光频率为 160 MHz,脉冲间 隔为 6.25 ns,上下侧交替激发样本。因此,经 Laser\_ SYNC 同步触发后,ADC 每 6.25 ns 采集到的数据为一侧 显微镜激发的连续区域的图像,对应到 5 个数字采样点。 解复用中使用 40 MHz 的 Laser\_SYNC 作为触发,结合 200 M 的 FPGA 时钟,40 为 80 和 200 的公因数,如此,在 Laser\_SYNC 和采样时钟锁相基础上,能够实现对每个激 光同步信号的精准捕捉,不会丢失 Laser\_SYNC 和采样 点,采样点能够按扫描时的时间精准还原,才能够在后续 的累加平均处理中,和上位机发来的由振镜运动所计算出 的像素采样点查找表所对应,除此之外,高采样率还可以 提升信号的信噪比。

解复用处理的时序如图 5 所示,在 Laser\_SYNC 的上 升沿到来后,FPGA 对两个通道的数据以相同方式进行固 定 5 个时钟周期的处理。以通道 1 (AI 0) 为例阐述处理 过程:第一周期对 4 个采样点存储;第二周期将上个周期 的 4 个采样点和当前周期的第一个采样点打包发送至 FIFO\_





图 5 解复用处理时序图

PMT\_Ch1\_TL,剩下3个采样点存储;第三个周期将第 二周期存储的3个采样点和本周期的前两个采样点打包发 送至FIFO\_PMT\_Ch1\_BL,剩下2个点存储;第4个周 期将上个周期存储的2个点和本周期的前3个采样点打包 发送至FIFO\_PMT\_Ch1\_TL,剩下一个采样点存储;第 五个周期将上周期留下的一个采样点和本周期的4个采样 点打包发送至FIFO\_PMT\_Ch1\_BL,至此一个解复用周 期结束,重新等待Laser\_SYNC信号的触发。如此而来, 对20个采样点按时间顺序进行解复用处理,解复用输出2 路数据,每路数据包含5个采样点,每路数据输出两次, 放入自身对应的FIFO中,供成像数据处理模块实时处理。 2.2.2 具体实现

在 LabVIEW FPGA 的 SCTL 中可使用条件结构实现用 于不同条件结构的 I/O 或应用状态,状态机架构以单周期 定时循环的速率运行。整个解复用处理在状态机逻辑控制 下完成,状态转移如图 6 所示,在未捕捉到 Laser\_SYNC 上升沿时,保持在 State0 状态,在捕捉到上升沿后,状态 发生跳转,依次执行 State1, State2, State3, State4,完成 一个周期的解复用处理,回到 State0 状态重新等待 Laser\_ SYNC 触发信号。



图 6 解复用状态转移图

本文中,State1~State4的解复用算法中用的函数、资源以及对数据的操作流程相似,不同点仅在于对当前采样 点数组拆分时的索引点选择不同(在图中已圈出),因此, 仅对 State0 和 State1 下的处理流程作详细阐述,程序如图 7 所示。State0下,读取两通道当前4个采样点,输出到采样 点寄存器组 pointReg [i](i=4, i)为数组长度)中,在该状 态下,对经过库函数上升沿检测的 Laser SYNC 信号进行 判断。输出为 False 时,将 State0 写入状态寄存器,下一时 钟周期继续执行 State0 下的操作,但每个周期都更新采样 点寄存器;输出为 True 时,输入 Statel 至状态寄存器中, 状态机下一状态发生转变,转变为 State1,顺序执行 State1 ~State4下的解复用算法。State1下,用 LabVIEW 中的拆 分一维数组函数将当前周期下采集的采样点数组 point Data [n] (本文 n 为 4, 指数组的长度) 拆分为两个子数组, 数组中元素类型为 I16,子数组 dataBefore 包含 point \_ Data [0] 至 point \_ Data [索引-1] 的元素,子数组 dataCur 包 含 point \_ Data [索引] 至 point \_ Data [n] 的元素, State1 ~State4 下拆分一维数组函数的索引依次为1、2、3、4, 使用创建数组函数将数组 PointReg 和 dataBefore 连接为一 个含有5个采样点的一维数组 dataFifo,写入当前状态下指 定的 FIFO,同时为该 FIFO 的输入是否有效赋值为 True, State1~State4 状态下交替写入 FIFO\_PMT\_Ch1\_TL、 FIFO\_PMT\_Ch2\_BL中,最后,使用替换数组子集函数 将数组 dataCur 数据更新至采样点寄存器组中供下一周期 使用。

在 LabVIEW FPGA 中,可以通过添加反馈节点或寄存 器实现流水线设计,反馈节点可保存上一次执行或循环的 结果,能够自定义输出延迟周期,实现方式为寄存器。本 文采用流水线技术,在当前采样点写入数组后插入反馈结 点延迟一周期输出,这样处理一是为了缩短关键路径的最 长传输延迟,在 SCTL 的定时保证下,使得每个迭代所需



图 7 解复用程序框图

投稿网址:www.jsjclykz.com

的时间刚好满足一个时钟周期,二是为保证 Laser\_SYNC 和采样点的时间同步性,因为 Labview FPGA 中上升沿检测库函数加入了反馈节点。

### 2.2.3 仿真验证

使用 LabVIEW 中的 FPGA 采样探针对通道 1 进行了仿 真,在 SCTL 以仿真模式执行时,采样探针提供数据的数 字波形视图,采样探针的放置点在图7中用数字进行了标 识,分别对 Laser SYNC、状态机状态 (State)、数字信号 采样点 (AI 0 Data < N-3.. N>)、FIFO\_PMT\_Ch1\_BL 和 FIFO\_PMT\_Ch1\_TL 写入有效性进行跟踪,在完成 FIFO 写入操作后,对两组 FIFO 中数据进行读取并验证采 样点解复用的正确性。FPGA 在 200 MHz 的主频、40 MHz 的 Laser\_SYNC 下对通道 1 复用的高速数据进行解复用, 仿真结果如图 8 所示,检测到 Laser SYNC 上升沿后,状 态机由 State0 开始转换(State0~State4 对应图 8 中 State 变量的 0~4),连续执行 5个时钟周期,由于上升沿检测函 数的延迟性, 依次处理的应该是上一周期采样点, State0 状态下,两个通道的 FIFO 写入标志都为 0,在 State1 下完 成第一次解复用,由图8能够看出,后续3次的解复用也同 样遵循上述流程。由于每通道数据连续完成两次对应解复 用算法后,重回 State0 等待触发信号,所以距离下次写入 FIFO 间隔两个时钟周期,且能够无间断进行解复用处理, 不会丢失 Laser\_SYNC,验证了所提设计的正确性。



图 8 解复用仿真时序图

#### 2.3 成像数据处理设计实现

经上述解复用处理后,通道1和通道2的数据各分为两路,进行数据的行场同步、像素采样点累加平均以及像素 灰度值的传输。通道1和通道2中上侧激光激发的区域使用 同一组行场同步信号,下侧激光激发的区域使用另一组, 由于两组数据的处理方法相同,这里以上侧激光激发区域 的成像数据处理为例进行介绍。

2.3.1 具体实现

整个成像数据处理模块由状态机进行驱动,状态转移 图如图 9 所示,由等场同步信号(Wait V\_sync)、等行同 步信号(Wait H\_sync)、像素值重建(Calculate)、写入 DMA FIFO(Write FIFO)4个状态构成。该模块的FPGA 处理时钟和数据解复用使用同源时钟。在Wait V\_sync下, 对采样点累加计数器、查找表地址计数器、行计数器、像 素灰度值累加平均计数器变量初始化,同时等待 V\_SYNC CH1 信号触发,在上升沿到达后,和上位机发来的成像 采集信号进行与操作,两者同时为 True 时,状态机发生跳 转,进入 Wait H\_sync; 在 Wait H\_sync 下,当 H\_ SYNC CH1上升沿到来,且当前行计数的值未大于上位 机设置的图像行数时,行计数器加1,状态机进入 Caculate, 若大于设置行数,则回到 Wait V sync 中重新等待 V \_SYNC\_CH1的触发,若触发信号未到,则回到 Wait H \_ sync; 在 Calculate 中, 当像素采样点累加次数未达到查 找表中当前像素值的总采样点数时,状态机保持当前状态, 直至完成一个像素点的重建后,跳转至 Write FIFO 状态, 将重建的像素灰度值写入与上位机通信的 DMA FIFO 中, 查找表地址计数器加1,行像素值计数器加1后与上位机设 置的图像列分辨率比较,满足一行数据,回到 Wait H\_ sync,反之回到 Calculate。



图 9 成像数据处理模块状态转移图

像素值重建处理流程如图 10 所示,程序如图 11 所示, 其中涉及到 FIFO 数据的读取,多个采样点的累加、乘法、 变量比较等操作,这一系列操作的路径延迟无法满足 200 MHz时钟频率下的定时需求。LabVIEW FPGA 中提供



图 10 像素值重建处理流程图



图 11 像素值重建程序框图

了高吞吐加法和乘法函数,可以配置寄存器输出实现流水 线处理,计算完成后有输出有效提示,可用于后续节点的 有效数据传递。为提高代码吞吐量,在采样点累加平均过 程中添加了并行累加操作和流水线,将5个点的累加平均 流程分为5级流水线执行,额外使用了累加器资源,加法 和乘法函数均设置为延迟一周期输出,第5个采样点读取 后延迟2个周期后做加法运算。前4个采样点两两并行相加 后再与第五个采样点累加,最后读取查找表中的相应权值 进行乘法运算。充分发挥了FPGA的并行处理能力,缩短 了关键路径。

对于 FIFO 缓存的设置,由于成像数据处理过程中绝大 部分时间都在进行像素值重建,在解复用后,会在下一个 时钟周期立马将 FIFO 中的数据读取并做累加平均计算,只 有当一个像素灰度值重建完成后,才会占用一个时钟周期 写入与上位机通信的 FIFO 中,因此,该周期下解复用后的 数据需要在 FIFO 中缓存一个周期,而在等行场信号时,解 复用的数据都是无效的,所以不需要缓存,因此,FIFO 的 深度设置为 2 即可。

2.3.2 仿真验证

对成像数据处理模块进行了仿真,用 FPGA 数据与分 析模块中生成方波发生器 VI 生成了频率为 30 Hz 场频和 15.8 kHz 的行频信号,Wait V\_sync、Wait H\_sync、 Calculate、Write FIFO 4 个状态依次对应 State 中枚举值 0~3,对行场信号、状态机当前状态以及每个状态的当前 有效值进行了采样探针跟踪,仿真结果如图 12 所示,结果 和设计的逻辑一样,且从 State 数据中能显示出单位像素值 重建时间满足正弦规律,能够通过非线性累加平均进行图 像畸变校正。



图 12 成像数据处理过程仿真时序图

对经过并行累加和流水线处理的累加平均过程也进行 了仿真, 仿真结果如图 13 所示, 一组 FIFO 中的数据读取 累加处理分为 5 个时钟周期处理, 而在各个时钟周期中, 又同时进行了其他数学运算, 仿真结果满足设计。



图 13 累加平均仿真时序图

# 3 实验结果与分析

#### 3.1 模拟测试结果

NI-5772 采集卡中 ADC 的电压输入量程为-1~1 V, 经 模数转换后,对应的采集输出值范围为-32 768~32 767, 输入与输出呈线性变化。用高速信号发生器生成频率为 80 MHz, 幅值 2 V, 偏移量为 0, 占空比为 50% 的方波, 接入 NI 5772 的 AI 0 中; 4 分频的 20 MHz 接入 AD9516 时 钟发生器,生成800 MHz 时钟信号接入CLK IN; 2 分频的 40 MHz 接入 TRIG; 函数发生器生成 15.8 kHz 的行同步信 号和 30 Hz 的场同步信号接入 AUX 接口中。在经过 FPGA 数据解复用和成像数据处理,上位机像素灰度值0~65 535 线性映射和图像重组处理后的两路图像如图 14 所示,颜色 呈一白一黑,图14(a)为FIFO\_PMT\_Ch1\_TL 重组后 的图像、图 14(b)为 FIFO\_PMT\_Ch1\_BL 重组后的图 像,分别对两张图像的平均灰度值、最大灰度值及最小灰 度值进行了分析,分析结果如表 1,图 14(a)和图 14(b) 的平均灰度值分别为 63 314.748 和 894.273。若采样点偏 差,5 ns 采集到 4 个高电平信号和 1 个低电平信号,那么最 大灰度值最高在 52 428 左右,与表中结果相悖,因此采样 点是准确的。该系统精确的将周期为 12.5 ns 方波中的高低 电平完成采集拆分、行场同步和累加平均处理,验证了系 统数据解复用和成像数据处理的正确性。





(a) FIF0\_PMT\_Ch1\_TL

(b) FIFO\_PMT\_Ch1\_BL

图 14 80 MHz 方波解复用及成像处理图

表1 解复用后两路图像灰度值分析表

|   | Area/pixel | Mean       | Min    | Max    |
|---|------------|------------|--------|--------|
| а | 262 144    | 63 314.748 | 63 233 | 63 385 |
| b | 262 144    | 894.273    | 821    | 926    |

#### 3.2 成像测试结果

以做过荧光标记的花粉为样本进行成像测试,图 15 为 该系统对两路 PMT 通道数据进行解复用和成像处理后的四 路图像。图 15 (a)、图 15 (b)、图 15 (c)、图 15 (d)分 别为上侧 PMT 上侧激光 (PMT\_Ch1\_TL)、上侧 PMT 下侧激光 (PMT\_Ch1\_BL)、下侧 PMT 上侧激光 (PMT \_Ch2\_TL)、下侧 PMT 下侧激光 (PMT\_Ch2\_BL)所 成图像。由图 15 (a)和图 15 (b)两张图中的标注 1、2 可 以看出,两张图的成像视角呈对立面,分别由上下显微镜 进行成像;由标注 3 能够看出,由于光的穿透深度以及样 本中的花粉相对于两侧显微镜的位置不同,能够观察到不 同的景深效果,荧光强度也有所不同。对四张图观察可以 看出,在相同的对比度下,上侧 PMT 上侧激光和下侧 PMT 下侧激光所成图像相比对侧 PMT 所成图像更亮,这 也说明了设计双侧 PMT 收集的重要性。由整体成像结果来 看,系统能够完成通道复用的两路数据的复杂处理。



(a) PMT\_Ch1\_TL



(b) PMT\_Ch1\_BL





(c) PMT\_Ch2\_TL

(d) PMT\_Ch2\_BL

图 15 时分复用成像系统双通道数据处理后的四路图

#### 3.3 畸变校正测试结果

系统畸变校正前后花粉成像对比图如图 16 所示,畸变 图像得到了较好的校正。图像中一个像素对应样品尺寸 1.04 µm,图 17 是对横线标出的区域 1 和区域 2 的花粉校 正前后的宽度对比。区域 1 经畸变校正,宽度由 30.68 µm 校正为 23.4 µm,对拉伸的图像边缘进行了缩放;区域 2 在 经过校正后,宽度由 26 µm 校正为 30.16 µm,对缩放的区 域进行了拉伸。





(a) 畸变校正前

(b)畸变校正后

图 16 畸变校正前后成像对比图

#### 4 结束语

为满足时分复用双独立扫描探测双光子显微成像系统 数据处理的实际需求,并解决由于硬件解复用装置复杂、 可移植性低,软件解复用又面临数据吞吐量大、不利于实 时成像等问题,本文提出了一种基于 LabVIEW FPGA 的集 数据解复用、行场同步、像素值重建、图像畸变校正功能 于一体的高速数据采集处理系统。整体采用状态机控制时



图 17 标记 1 和标记 2 校正前后宽度对比图

序逻辑,实现了高时钟分辨率下数据的无损处理,系统开 发周期短,可维护性高。通过仿真和成像测试,系统工作 稳定,满足项目的实际使用需求。该采集处理方案设计为 时分复用显微成像系统中高速数据处理提供了新的方法。

# 参考文献:

- [1]张 泽,侯国忠,邓岩岩,等.小鼠大脑飞秒双光子荧光三维显微成像研究[J]. 红外与激光工程,2023,52(8):277-287.
- [2] WU L, LIU J, LI P, et al. Two-photon small-molecule fluorescence-based agents for sensing, imaging, and therapy within biological systems [J]. Chemical Society Reviews, 2021, 50 (2): 702-734.
- [3] 李浩宇,曲丽颖,华子杰,等.基于深度学习的荧光显微成像 技术及应用 [J].激光与光电子学进展,2021,58 (18):185 -204.
- [4] 丛 斌,张世明,倪志宇.聚焦生命领域三大科学问题,构建 全息人体数字模型--以医学为例[J].中国科学院院刊, 2021,36(7):807-813.
- [5] 郝冬梅,李 莹,李明爱. 基于功能磁共振成像的大脑运动皮 层网络连通性研究 [J]. 中国生物医学工程学报,2009,28

(3): 403 - 407.

- [6] 孙试翼. 双光子显微成像分辨率、对比度及视场提升的方法与 技术研究 [D]. 杭州:浙江大学, 2021.
- [7] 闫天宇,何 颖,王鑫宇,等.快速三维荧光显微成像技术的 研究进展[J].红外与激光工程,2022,51(11):68-81.
- [8] 陈 帅,任 林,周镇乔,等.在体跨尺度双光子显微成像技术 [J].中国光学,2022,15(6):1167-1181.
- [9]姚 靖,余志鹏,高玉峰,等.大视场双光子显微成像系统研究进展(特邀) [J]. 红外与激光工程,2022,51 (11):17-27.
- [10] KIM T H, SCHNITZER M J. Fluorescence imaging of largescale neural ensemble dynamics [J]. Cell, 2022, 185 (1): 9 - 41.
- [11] 刘晓宇,刘紫千,斯 科,等. 微型化显微成像系统的关键技术及研究进展(特邀)[J]. 激光与光电子学进展,2024,61
  (2):164-181.
- [12] 张华夏,陈青山,王艳林.基于双缓存技术实现光谱数据高速 采集与处理 [J]. 电子测量技术,2022,45(13):54-58.
- [13] LECOQ J, SAVALL J, VUCINIC D, et al. Visualizing mammalian brain area interactions by dual-axis two-photon calcium imaging [J]. Nature Neuroscience, 2014, 17 (12): 1825 - 1829.