摘要
鱼类表型组学是在基因组水平上系统研究鱼类表型信息的学科,通过对鱼类表型特征、基因组信息及环境条件之间的联合分析,揭示鱼类应对环境变化的响应及适应机制,可为鱼类的养殖生产实践提供有价值的信息和指标。将鱼类表型组学与基因组学相结合是提高养殖鱼类选择育种效率的有效途径。相较于基因组学研究的快速发展,鱼类表型组学发展相对滞后。由于鱼类特殊的水生环境、较高的养殖密度以及较强的运动能力,导致目前对鱼类表型数据的获取仍存在困难,加之研究群体规模的不断扩大,鱼类表型数据的高通量精准获取和分析更加难以实现,已成为限制鱼类表型组学研究发展的瓶颈。近年来,传感器技术和人工智能的发展为鱼类表型组学研究提供了高通量、无损且精确的方案,可显著提高鱼类表型的分型效率,成为解决这一瓶颈问题的有效方法。本文综述了表型组研究的发展历程,提出了鱼类表型组学的研究策略,整理了鱼类表型组学的研究现状、鱼类表型组数据获取的主流方法,最后提出了鱼类表型组学研究存在的问题及其应用前景,以期丰富对鱼类表型组学的认知,为提升鱼类遗传育种效率提供参考。
Abstract
Fish phenomics is the science that systematically studies fish phenotypes at the genomic level. Through the integrated analysis of fish phenotypic characteristics, genomes, and environmental conditions, fish phenomics can decipher the response and adaptation mechanisms of fish to the environment, which could provide valuable information and indicators for fish farming. Combining fish phenomics and genomic analyses has significant potential for increasing the efficiency of fish breeding. Nevertheless, compared with the rapid development of genomics research, the development of fish phenomics is relatively slow. Owing to the aquatic environment, high breeding density, and swimming ability of fish, it is difficult to determine their phenotypes accurately. In addition, with the expansion of the research population, high-throughput and accurate acquisition and analysis of fish phenotypes on a large scale have become more challenging, becoming one of the major bottlenecks hindering fish phenomics research. Recent advances in novel technologies, including sensor technology and artificial intelligence, have provided potential solutions to resolve this bottleneck and improve the efficiency of fish phenotyping by using high-throughput, noninvasive, and accurate methods. This study provides an overview of the history of phenomic research. We then propose strategies, introduce high-throughput phenotyping approaches, and discuss the status quo of fish phenomics research. Finally, we discuss challenges and provide perspectives on fish phenomics research. This review considers fish as the main research object, covers the current mainstream methods and progress in fish phenomics research, and aims to enrich the understanding of fish phenomics research. This review provides aquaculture researchers and fish farmers with updated information and valuable references for subsequent research and practices in fish phenomics.
Keywords
1 表型组的发展历程
“表型(phenotype)”一词来源于希腊语“phainein”(表现)和“typos”(类型)的组合,其生物学概念最早由丹麦遗传学家 Wilhelm Johannsen 提出(Johannsen,1911),认为表型是用来区分生物体的形状、结构、大小、颜色等全部可测的外在表现,是基因型(genotype)和环境因素(environmental factors)复杂交互的结果,基因型是表型呈现形式的内部因素,而环境是表型呈现形式的外部条件。表型组和表型组学概念的形成和发展与基因组和基因组学紧密相关。伴随着基因组概念的提出和发展,与之对应的“表型组”(phenome)的概念在 1949 年第一次被提及(Davis,1949),其定义为细胞质或者细胞核的外基因和自体繁殖部分之外的总合,是生物表型的物质基础。此后, Soulé(1967)认为表型组为生物体全部表型的集合。目前,对表型组的定义仍没有达成共识。多数学者认为表型组是一个基因型的生物在一个特定环境下所表现出的一系列结构上、生理上和性能上相关的所有特征的集合(Chen et al,2015; Großkinsky et al,2015; Houle et al,2010)。此外,部分学者强调时间维度和表观遗传因素同样应该是表型组研究的重要组成部分(Zavafer et al,2023)。
Steven A. Garan 首次提出表型组学(phenomics)的概念,随后其作为一个全新的学科主要用于分析人类基因和临床症状表现的关系(Schork,1997)。Niculescu 等(2006)提出 Pheno Chipping 表型组学分析实验定量方法可以将表型组与基因组学结合起来,对于表型组学的发展具有里程碑意义。目前,表型组学是在基因组水平上系统研究生物体或细胞在不同环境条件下所有表型的学科,其研究利用的是多尺度、多维度的全方位数据,包括空间尺度(小至核苷酸序列和细胞,大至组织、器官、个体及群体)和整个生命周期的时间维度信息(Zavafer et al,2023; Watt et al,2020; 胡伟娟等,2019; 周济等,2018; Houle et al,2010)。表型组学的研究绝不是简单的对表型信息进行采集,而是需要多学科间的交叉和多组学的联合分析,通过对表型数量变异的量化分析,系统结合基因组信息、环境条件和管理方式,把表型研究中产生的海量图像和传感器数据转化为具有生物学意义的数据集,进而解析表型的形成机制(Watt et al,2020; Yang et al,2020; 周济等,2018; Furbank et al,2011; Houle et al,2010)。有科学家提出,表型组学研究是未来十年生命科学新的焦点和热点领域,其在生物功能基因组学等研究领域有潜在的应用价值(王小强等,2023)。
近年来,基于大规模表型数据收集和分析的表型组学研究技术已经在模式生物(Watson et al,2020; Tills et al,2018)、人类(Lan et al,2023; Ying,2023)、农艺植物(Walsh et al,2024; Sun et al,2022)和家畜(Upadhyay et al,2024; Pérez-Enciso et al,2021)中取得了一定的发展。其中,植物表型组学已形成了全植株形态、全生活周期以及全栽培尺度的研究框架,且向着规模化、自动化方向发展,并在植物功能基因组学和栽培育种实践中发挥着重要作用。相较于植物表型组学研究,鱼类表型组学研究起步较晚,且仍处于发展的初期(Fu et al,2022; Vieira Ventura et al,2020)。尽管陆生生物表型组学研究的部分方法可以为鱼类研究提供借鉴和指导,但特殊的水下生存环境使得鱼类表型测定难度更大(鲍镇宁等,2023);其次,鱼类较大的养殖密度且具有很强的运动能力,导致对其个体的识别及表型特征的原位获取和分析更加困难(Føre et al,2023; Houston et al,2020);此外,传统陆生生物表型测定方法需要以空气为介质,而鱼类离水后往往会产生应激反应,导致其受伤害甚至死亡。以上原因导致鱼类表型组研究不能完全借鉴陆生生物的表型组学研究模式。目前,鱼类表型组学研究仍主要专注于鱼类表型高通量获取技术的开发,还未广泛应用于鱼类的功能基因组学和育种实践中。
我国是世界第一大水产养殖国,养殖产量约占全球的 60%,其中,鱼类养殖产量占全国水产养殖总产量超过 52%,鱼类养殖在提供优质健康食物和保障国家食物安全中发挥着重要作用(FAO,2024; 农业农村部渔业渔政管理局等,2024; 张文兵等,2023; 张妙玲等,2023)。在鱼类养殖产业快速发展的同时,仍存在良种选育研发滞后和种质退化等问题(FAO,2024; Zhou et al,2024; 关长涛等,2020)。近年来,通过表型组–基因组联合分析的育种手段对鱼类进行遗传改良是提高养殖鱼类选择育种效率的有效途径,该育种策略则高度依赖于基因组信息、表型组信息以及基因型 –表型之间的关系(Tuggle et al,2024; Zhou et al,2024; Sun et al,2022)。鱼类表型组学研究通过分析鱼类基因信息、环境条件及表型之间的关系,揭示鱼类应对环境变化的响应及适应机制,可为鱼类的养殖生产实践提供有价值的信息和指标。我国目前已对 60 余种鱼类的基因组数据进行了组装和注释,并鉴定出了与鱼类生长发育、性别决定、抗病性、变态和色素沉着等关键表型的相关遗传位点,为鱼类选择育种技术的建立提供了广泛的基因组信息(Zhou et al,2024)。然而,在育种过程中对鱼类表型数据的精准获取仍存在困难,加之研究群体规模的不断扩大,表型数据的高通量获取和分析更加难以实现,已成为鱼类表型组学研究的瓶颈。开发适合于鱼类的高通量、高精度且低成本的表型获取和分析技术有望更加高效地获取目标表型信息,推动解析重要性状形成机制,从而加速养殖鱼类的遗传改良(Awada et al,2024; Houston et al,2020)。本文提出了鱼类表型组学的研究策略,整理了鱼类表型组数据的主流获取方法,并依据鱼类重要的表型性状,对当前鱼类表型组研究进展进行梳理和总结,最后对鱼类表型组研究中存在的问题进行了讨论。
2 鱼类表型组学研究策略
鱼类表型组是指鱼类在其生活史过程中与生存环境相互作用表现出的所有表型特征的集合。鱼类的表型非常多样化,可以从不同的层面和尺度进行描述,从复杂种群的社会行为到每个个体的体重、尺寸和外观,甚至单基因水平的基因表达都可以进行表型的表征(Milla et al,2021; Mabee et al,2012)。本文将鱼类表型特征分为 5 类,分别是形态结构表型、生理生化表型、产出表型、行为表型和其他表型,以上 5 种类别的表型涵盖了鱼类生物学、鱼类育种计划和鱼类管理中所涉及的大多数表型性状(图1)。
养殖鱼类表型组受到遗传因素(genome,G)、环境因素(environment,E)、管理因素(management,M)以及三者间复杂的相互作用(G×E×M)共同影响,不同环境因素和管理因素通过影响基因组的某些基因突变或者影响表观遗传因子调控关键基因网络和核心基因的转录(转录组),调节蛋白质的翻译(蛋白质组)及代谢产物(代谢组),进而形成不同的表型特征(包括数量性状和质量性状)以适应不同的环境条件和管理方式,即通过调节生长发育或生理生化状态来影响鱼类表型组;利用高通量的表型获取技术与多尺度的表型分析平台相结合,可以获取和分析鱼类整个生命周期内在不同生存条件下的形态、生理、生化和分子特征等表型性状,从而揭示鱼类对不同环境的响应及适应机制,并通过建立和识别应对环境的稳定预测因子,提高表型性状选择效率,从而为鱼类生产实践提供有价值的信息和指标(图2)。
图1鱼类的表型性状
Fig.1Phenotypic traits of fish
Fig.2Illustration of the relationship among genome, environment, management and their interactions (G×E×M) , which determines phenome (adapted from Großkinsky et al, 2015)
为了提高鱼类功能基因组学研究效率,加快鱼类育种的选择速度,提高鱼类适应力和产量稳定性,本文提出了鱼类表型组学的研究策略(图3)。首先对鱼类种质资源群体进行表型鉴定,其目的包括新品种或者新品系的选育、目标性状的评价和新型养殖种类的评估;研究人员根据鱼类表型性状的系统分类,设计有效的鱼类表型组学研究方案;通过利用不同养殖模式和养殖阶段下高通量、多尺度的表型分析平台可以获得大量种质资源群体的动态表型特征;使用复杂的数据管理手段对表型数据集进行注释、标准化和存储后,将表型数据与其他组学数据(包括基因组、转录组、蛋白质组、代谢组等)进行整合分析;最后根据表型组学的研究结果对鱼类的优良性状进行选择、养殖管理模式进行优化以提高鱼类功能基因组学的研究效率,加快新品种或者新品系的选育速度。
3 鱼类表型组数据的高通量获取方法
表型组理论的发展为表型组学技术的快速发展奠定了基础。近年来,传感器技术和人工智能的发展为快速、准确且无损地高通量获取生物体表型性状创造了前所未有的机遇。光学传感作为全球数字化的主要成果,以其非侵入性、高通量、客观等特点广泛应用于生物的表型组学研究领域(Sun et al,2022)。光学传感器可根据不同波长下产生的不同电磁响应分为可见光成像、激光扫描、高光谱成像、计算机断层扫描和核磁共振成像等,以上传感器在鱼类不同尺度的表型组研究中发挥着重要作用。声学传感器在鱼类表型组研究中存在潜在的优势。按照应用尺度的不同,声学传感器分为超声成像和声呐技术两类。声呐具有在水下长距离传播的特性,因此被认为是水下目标远程探测和识别的有利工具,声学成像技术可以在暗环境中有效获取水下信息的同时不对鱼类产生额外的胁迫(Li et al,2024a)。此外,生物传感器在生物的健康及福利等表型研究方面也发挥着重要作用(Brijs et al,2021; Endo et al,2019)。表1总结了不同传感器的原理,以及在鱼类表型组研究中的优势、缺点及应用。
3.1 光学传感器
3.1.1 可见光成像
可见光成像技术是鱼类表型组研究中应用最广泛的光学成像技术,其基于硅传感器[主要为电耦合传感器(CCD)和互补金属氧化半导体感器(CMOS)]在 400~750 nm 的可见光光谱区域内形成蓝色(B,~450 nm)、绿色(G,~550 nm)和红色(R,~600 nm)的光谱波段与光子通量相关的强度值形成的空间矩阵来构成样品的原始二维图像信息。可见光成像主要包括记录静态的数码相机设备和记录动态的摄像机设备。此外,近年来快速发展的双目立体视觉系统包括并排排列的 2 个摄像机,可以对鱼类不同角度和位置的图像同时获取,从而获得传统二维图像无法获取的三维表型。配合机器视觉技术,可见光成像已应用于鱼类形态学(Freitas et al,2023)、体重(Fernandes et al,2020)、色泽(Coulmance et al,2024)、行为(隋金柱,2024)以及肌肉品质(Saberioon et al,2017)等表型研究。
图3鱼类表型组研究策略
Fig.3Strategies of fish phenome research
表1不同传感器的原理以及在鱼类表型获取中的优势、缺点及应用
Tab.1The principle, advantages, disadvantages and applications of different sensors in fish phenotyping
3.1.2 激光扫描
激光扫描技术是一种三维立体重建技术,其根据近红外或者远红外光谱区域激光的发射和接收时间来测量物体到传感器的距离,通过高频的激光发射和接收生成大量高分辨率的三维点云,从而实现被测量目标高精度的三维立体重建。激光扫描技术主要包括飞行时间(time of flight,ToF)技术和激光探测及测距(light detection and ranging,LiDAR)技术两种。目前,激光扫描技术已应用于鱼类三维形态学表型的研究(Liao et al,2021)。
3.1.3 高光谱成像
高光谱成像技术可同时捕获研究对象高分辨率的光谱信息和空间信息,并将光谱信息与空间信息融合生成 3D 空间的高光谱图像立方体(hyperspectral data cube,Hypercube)。Hypercube 中包含数百至数千个窄光谱波段信息和二维空间信息。高光谱成像的传感器主要为 CCD 传感器、CMOS 传感器和捕获短波红外的铟镓砷传感器,其通常涵盖了可见光波段(400~700 nm)、近红外波段(700~1 000 nm)和短波红外波段(100~2 500 nm)的光谱信息,基于不同波段光谱与组织和生化组分的相互作用可以实现对鱼类表型特征的无损测量。作为一种快速和非侵入的大规模样品检测方法,高光谱成像技术不仅具有分辨率高、非破坏性、多组分同时测定等光谱技术优势,同时具有直观形象、精确度高且可视化等图像技术优点。目前,高光谱成像技术已应用于鱼类的色泽(Wang et al,2022)、肌肉质构特征(Cao et al,2023)、蛋白质含量(Bhargava et al,2024)、脂肪含量(Cao et al,2024)、水分含量(Zhang et al,2020)等多种品质表型的研究。
3.1.4 电子计算机断层扫描
电子计算机断层扫描技术(computed tomography,CT)是一种通过对不同拍摄角度和不同层次 X 射线(10~1 000 pm)图像重建,生成内体组织器官 3D 图像的技术。其根据不同组织对 X 射线的吸收与通过率的不同对身体内部的组织进行区分。CT 技术包括显微 CT、增强 CT、双能 CT、多能 CT 和光子计数 CT 等形式。显微 CT 的分辨率较高,可以达到微米级别;增强 CT 是一种利用造影剂使得不同部位组织得以进一步区分的 CT 扫描形式;双能和多能 CT 是指通过增加第二条或者多条 X 射线获得额外的衰减测量来更好地区分多种组织;光子计数 CT 在提供高质量图像和降低辐射剂量方面表现出巨大的潜力。CT 技术已应用于鱼类骨骼发育(Goatley et al,2018)、肌肉品质(Wang et al,2021)和组织器官表征(Weinhardt et al,2018)等表型研究。
3.1.5 核磁共振成像
核磁共振成像(magnetic resonance imaging,MRI)通过在静磁场中施加特定频率的射频脉冲和特定方向的磁场梯度使被测样品中 1H、13C、14N、15N 和 23Na 等原子的原子核自旋产生的核磁共振信号变得位置依赖,从而实现空间位置信息的编码。使用傅里叶变换等图像重建技术就可解码被编码在频域空间的磁共振信号,进而重建出样品在三维空间中的图像。其中 1H 是 MRI 最常用的核原子团,因为其在生物体内以水的形式大量的存在且最容易被检测到。生物体不同组织中质子密度差异导致了组织间弛豫时间[纵向弛豫时间(T1)和横向弛豫时间(T2)]的变化,从而在 MRI 中产生不同的信号。MRI 技术已应用于鱼类器官发育、骨骼发育(Clark et al,2023)和肌肉品质(Tawara et al,2022)等表型研究。
3.2 声学传感器
3.2.1 超声成像
超声成像技术是基于运动超声波的声阻抗,通过对反射信号的接收和处理,以获得体内器官图像的技术。超声成像包括 A 模式、B 模式、 M 模式和多普勒模式等多种模式,其中,A 模式提供反射信号中最简单、最原始的深度信息;B 模式利用带有传感器阵列的探头来构建二维的图像信息;M 模式通过施加脉冲波来记录运动信号;多普勒模式则可利用多普勒原理记录血流的速度和方向。B 模式的超声成像技术已应用于鱼类的肌肉品质(Tokunaga et al,2020)、性别鉴定以及性别发育(Chebanov et al,2018)等表型的研究。
3.2.2 声呐
声呐发出的声波脉冲在水中传输,当遇到生物体时,生物体对入射声波产生了散射,部分后向散射的声波信号被接收器接收,通过对接收到信号的积分可以得到声波脉冲向后散射信号的能量,利用能量数据结合鱼类对声波散射特性可以对鱼类的生物学性状进行鉴定。声呐技术已应用于鱼类的形态学、生物量、行为特征、产卵和繁殖等表型的研究(Li et al,2024a)。
3.3 生物传感器
基于电子学技术的生物传感器可利用酶或者抗体等生物过程中的分子相互作用来识别特定的目标物质。当与目标物质结合反应时,酶或者抗体便成为了目标物质的信号分子。由于反应过程中化学物质的产生或者消耗会引起电流、电阻和热量等参数的微小变化,生物传感器利用电极或者光学元件等信号转导原件将这些微小的变化转化为电信号,通过检测电信号的变化可以实现对目标物质的简便和快速测量。由于生物传感器具有高灵敏度和高特异性的特点,目前已应用于鱼类的生理表型研究(Wu et al,2019)以及鱼类行为学研究中(Cui et al,2025)。
3.4 人工智能在鱼类表型组研究中的应用
传感器技术的进步为表型组数据的高通量获取提供了有效的技术手段,同时其产生的海量复杂数据也对后续的表型组学研究带来了巨大的挑战。近年来,随着物联网、大数据、人工智能等新一代信息技术的不断进步,通过计算机代替人工实现海量信息的传输、储存、分析、处理和决策成为可能。目前已形成以传感器采集信息为基础的感知层,以物联网和云平台为基础的传输层,以人工智能处理为基础的分析决策层以及后续支持管理和实践的应用层等多层级体系结构(梁晨等,2024; Zhao et al,2021; 李道亮等,2020)。人工智能作为体系结构中最重要的一部分,通过模拟人类的思维和智能行为,学习由传感器采集的海量信息,对不同环境条件下鱼类的表型特征进行判别和分析,实现从鱼类原始表型特征到有生物学意义的表型组数据的转化,后续结合多组学的数据解析表型的形成机制,最终指导养殖鱼类的生产实践。根据学习框架复杂程度的不同,可以将人工智能分为机器学习(machine learning,ML)和深度学习(deep learning,DL)两类。
3.4.1 机器学习
机器学习泛指通过计算机对输入数据进行分析,建立与数据对应的拟合或者分类模型的过程,其本质上是以客观、高效的方式通过计算近似或模拟人类对数据的识别模式(Greener et al,2022)。其中线性回归是最为经典且简单的机器学习方法,除此之外,还包括偏最小二乘回归(partial least square regression,PLSR)、决策树(decision tree,DT)、梯度提升算法(gradient boosting,GB)、随机森林(random forest,RF)、支持向量机(support vector machine,SVM)等方法。相较于复杂的深度学习方法,机器学习具有开发简单、可解释性强等特点,因此,其常用于数据量较少且结构关系简单的表型数据获取和分类研究。然而,机器学习处理原始形式自然数据的能力有限,面对更多高维度、高度多样性的表型数据的累计,机器学习在分析处理复杂数据方面的有效性受到限制(王子元等,2024; Greener et al,2022)。
3.4.2 深度学习
深度学习是指基于复杂人工神经网络(artificial neural network,ANN)尤其是深层神经网络(deep neural networks,DNN)的机器学习方法。其第一层为输入层,最后一层为输出层,中间包括大量复杂的神经网络隐藏层,深度学习通过大量数据训练模型以实现自动化的数据特征提取和模式识别,并对其他同类数据提供预测功能(Fernandes et al,2025; Webb,2018; LeCun et al,2015)。深度学习主要包括卷积神经网络(convolutional neural networks,CNN)、循环神经网络(recurrent neural network,RNN)、图卷积网络(graph convolutional network,GCN)、反向传播神经网络(back propagation neural network,BPNN)、CNN 与 RNN 结合的网络及双流卷积神经网络(two-stream convolutional network,TSCN)等学习框架。不同于传统的机器学习方法,深度学习的计算模型通常对多个处理层的数据进行学习,且每个处理层通常具有多个抽象级别的数据表示,因此,深度学习更擅长基于海量和高维的表型组数据建立复杂的结构关系(王子元等,2024; 彭秋珺等,2023; Webb,2018)。但深度学习通常需要大量的标注数据来进行训练,收集和标注数据的成本较高,且模型往往具有较大的参数量和计算复杂性,需要较高的计算资源和存储空间(Fernandes et al,2025; Mandal et al,2024; Zhao et al,2021)。
4 鱼类表型组的研究现状
鱼类育种的主要目标是培育产量高、品质优和抗逆性强的优良品系或新品种。高通量且精准的获取和分析鱼类形态结构表型、生理生化表型、产出表型、行为表型和其他表型共 5 类表型信息,对了解鱼类生长、发育、品质、饲料转化率、生理状态、抗病抗逆等具有重要的经济价值和科学意义(Li et al,2019)。因此,鱼类表型组学研究也大都围绕以上重要表型开展。
4.1 形态结构表型
鱼类的形态结构表型是鱼类生物学研究和育种计划的基础,通过不同时期鱼类的形态学表型数据结合体重信息是衡量经济鱼类生长情况的重要方法,也直接决定了鱼类的商业价值(Vandeputte et al,2019; Gjedrem et al,2014; Yue,2014)。鱼类形态结构表型分为外部形态表型和内部构造表型两类。
4.1.1 外部形态表型
传统的鱼类外部形态表型测定方法需将活体鱼从水体提取出来,经麻醉后进行人工测量,测量参数通常包括全长、体长、体宽、肛前体长、吻长、眼径、眼间距、眼后头长、头长、体高、尾柄长、尾柄高等 12 个可量表型性状(图4a)及 21 个框架表型性状(图4b)(王同等,2024)。虽然传统的测量方法易于操作、成本低,但要耗费大量的人力和时间,无法在短时间内精准完成大量的表型测定,而且容易使鱼类产生应激反应甚至伤害(李忠慧等,2023)。
Fig.4The morphological phenotypes of groupers (from Wang T et al, 2024)
a:可量表型性状;b:框架表型性状。
a: Quantitative phenotypic traits; b: Quantitative phenotypic traits.
随着机器视觉、机器学习和深度学习等技术的发展,图像识别技术已经在获取养殖鱼类外部形态结构中得以应用,可以对鱼类个体的多个表型进行同时测量(Gümüş et al,2021)。目前,基于图像识别的形态学性状测量主要分为离水测量和水下测量两类。离水测量是将鱼体从水中取出后置于固定的位置,通过一台或者多台相机进行鱼类体侧的 2D 图像信息的获取,并结合最小偏二乘、卷积神经网络、深度学习网络等机器学习和深度学习算法,获取精准的鱼类外部形态学表型特征。该方法对设备和测量环境的要求较低,目前已应用于欧洲舌齿鲈(Dicentrarchus labrax)(Monkman et al,2019; Costa et al,2013)、尼罗罗非鱼(Oreochromis niloticus)(Fernandes et al,2020)、欧洲鲶鱼(Silurus glanis)和非洲鲶鱼(Clarias gariepinus)(Gümüs et al,2021)、细鳞肥脂鲤(Piaractus mesopotamicus)(Freitas et al,2023)等鱼类的形态学表型研究中,以上研究结果表明,基于离水图像的机器视觉技术不仅对体长、体面积等常规形态学表型具有较高的获取精度(误差通常低于 5.0%),并且可以实现鱼类头、身体和鳍部的准确分割,从而对鱼类体型和形态学表型进行更细致的描述。此外,通过以上表型信息建立的体重、胴体重和胴体产量等预测模型,相比于单纯利用体长信息建立的模型具有更高的预测精度(Fernandes et al,2020)。
虽然基于离水图像的机器视觉技术提高了获取鱼类外部形态学表型的通量,且具有较高的精度和可重复性,但其仍需要将鱼从水体提取出后进行数码图像的获取,可能使鱼产生应激或者伤害。因此,水下图像获取系统在原位获取鱼类外部形态学表型方面更具优势。其中,单目相机是指利用一个相机对一个平面内固定位置的目标进行测量,常用于平面测量中。研究人员利用水下单目相机,采用管道诱导方式获取鱼体侧面图像,并结合同态滤波、光改善、增强对比度和减少鱼的数量等方法增强图像的信息,实现了鱼图像的分割,最后通过鱼中点位置建立的三阶多项式回归来估测鱼的长度,并结合多种回归算法实现了对鱼的体重和尺寸的自动测量,误差<4.00%(Sanchez-Torres et al,2018)。虽然这种模式对硬件设备要求不高,但对被测鱼的空间和方位都进行了限定,操作时要求鱼的体轴和摄像机的光轴近似垂直才能获得较好的成像和预测效果。双目立体视觉使用参数设置一致,但位置不同的两个并排摄像机对同一目标进行同步采集,利用三角测量原理计算出对应像素点的视差,恢复三维位置坐标,从而对目标物体的形态学参数进行获取,克服了对鱼类空间限定的要求。研究人员通过利用水下双目立体视觉系统结合不同机器学习方法建立了斑石鲷(Oplegnathus punctatus)、青石斑鱼(Epinephelus awoara)和虎龙杂交斑(Epinephelus fuscoguttatus♀×Epinephelus lanceolatus♂)体长测量方法,其中对斑石鲷体长测量平均误差小于 2.55%(Shi et al,2020),对青石斑鱼和虎龙杂交斑体长测量的误差分别为 3.84%和 2.95%(Chang et al,2021),具有较高的预测精度。以上研究结果均表明,自动图像识别技术是测量鱼类外部形态表型的理想方法(Hao et al,2016)。
基于机器视觉的表型获取方法对鱼类的体长和体重等表型有较好的预测效果。然而,相比于传统方法可以测定大量外部形态学表型特征,上述方法能获取的形态学表型参数较少,不能满足鱼类表型组研究中精细化表型获取的需要。此外,鱼类所表现出的精细和复杂的立体表型是基于以上机器视觉技术很难获取的。Liao 等(2021)利用工业激光雷达相机获取鱼类的 3D 点云信息,开发了鱼类的 3D 形态学表型分析软件 3DPhenoFish,软件经过背景过滤、目标分割、关键位置识别等步骤自动识别鱼类体长、表面积、体积等重要的 2D 和 3D 形态学表型性状。利用该软件对裂腹鱼亚科(Schizothoracinae)中 4 个种[昂仁裸裂尻鱼(Schizopygopsis younghusbandi)、尖裸鲤(Oxygymnocypris stewartia)、双须叶须鱼(Ptychobarbus dipogon)和异齿裂腹鱼(Schizothorax oconnori)]进行外部形态学测定,软件自动获取的表型性状与人工测量值高度线性相关(r>0.94)。何志鹏等(2024)利用了水平和垂直两个相机获取了黄颡鱼(Pelteobagrus fulvidraco)侧视和俯视两个视角的数码图像,结合 YOLOv8 算法能够完成对黄颡鱼体面积、头面积、全长、头长、体高等 11 个形态学表型特征数据的快速测量,且平均相对误差约 1.00%。
近年来,通过分析鱼类外部形态学表型特征实现鱼类性别判定的计算机视觉技术为鱼类性别的无损鉴定提供了一种可行方案。Costa 等(2013)利用图像分析系统结合偏最小二乘判定法高通量地鉴定欧洲舌齿鲈的性别,其鉴定准确率为 82.05%,为养殖欧洲舌齿鲈的性别筛选提供了技术支撑。通过对不同性别鱼体背部骨板的形态学特征的分析,并结合不同计算机图像识别方法,Barulin(2019)建立了小体鲟(Acipenser ruthenus)性别鉴定模型,发现第 1~5 背板的 Tl/Tw 指数和 Fill 指数是区分小体鲟性别的重要指标,最佳模型的性别鉴定准确率为 97.22%,该研究为利用人工智能识别鲟鱼性别提供了广阔的前景。
4.1.2 内部构造表型
在许多海洋鱼类中,畸形的发生率很高,其中,骨骼畸形是一个重要的表型性状,因为它们会影响鱼类的发育、福利和经济价值(Vandeputte et al,2019; Boglione et al,2013)。对鱼类骨骼发育研究的经典方法需经过染色连同形态学观察,该方法通常需经过复杂的固定、冲洗、软骨染色、肌肉消化、硬骨染色和脱色等步骤。通过对传统文献中描述鱼类骨骼表型的收集,构建了 Phenoscape Knowledgebase 鱼类骨骼表型数据库,该数据库涵盖 2 500 种硬骨鱼类的超过 50 万个表型注释(Mabee et al,2012)。虽然传统骨骼研究的方法经典且有大量的参考数据,但鱼类骨骼表型获取的步骤繁琐,完成实验周期约为 2 周(吕雪娇等,2018),很难满足高通量表型获取的需要。近年来,micro-CT 等技术在鱼类骨骼发育的表型研究中发挥着越来越重要的作用。 Gisbert 等(2012)利用 micro-CT 技术对大西洋白姑鱼(Argyrosomus regius)的脊椎骨表型进行获取,研究表明,micro-CT 不仅能清晰地识别骨骼的组成和结构,还能对图像进行轴向切割,从而区分不同密度的组织。Deary 等(2016)利用 micro-CT 技术评估了石首鱼科(Sciaenidae)鱼类早期生活史阶段感官系统的个体发育模式,测量了与嗅觉、视觉、味觉、听觉和机械性感受相关的大脑区域的大小,结果表明,视觉神经束是石首鱼科鱼类最大的感觉区域,表明视觉是该鱼早期生活史最主要的感觉方式。Brinkmann 等(2016) 利用 micro-CT 获取虹鳟(Oncorhynchus mykiss)的影像学数据并对虹鳟的内部构造进行研究,表明 micro-CT 可以对不同的器官如眼、头肾、鱼鳔、肝脏等进行分割研究,这为非侵入式研究不同脏器指数和胴体质量奠定了基础。Charles 等(2017)利用 micro-CT 技术对斑马鱼(Danio rerio)椎骨和颅底副蝶骨的形状和密度进行了测定,结果表明,大多数的骨骼变量与标准长度密切相关,但在生长后期(>3 个月),一些骨骼的测量存在年龄依赖效应。通过对具有骨骼缺陷的斑马鱼进行全面、精准的表型测量,可以为解释分子、细胞和组织生物力学特性如何影响斑马鱼骨骼的形成提供新的见解(Fuentes et al,2018)。Goatley 等(2018)利用 micro-CT 技术评估了双斑刺尾鱼(Acanthurus nigrofuscus)尾鳍的畸形情况,研究表明,该鱼双尾畸形与尾下骨板和尾椎的加倍有关。Weinhardt 等(2018) 利用 micro-CT 技术首次建立了青鳉鱼(Oryzias latipes)的 3D 注释解剖图谱,包括骨骼和内部器官(图5),并对组织和器官进行了定量的描述,为后续研究硬骨鱼类基因型和内部构造表型的关联奠定了基础。
部分水产养殖鱼类的性别与生长有很大关系,提前性成熟往往会导致生长速度减慢、饲料转化率降低以及鱼肉品质下降,因此,判断性成熟的时间是养殖鱼类的重要表型(Gutierrez et al,2023; Vandeputte et al,2019; Baroiller et al,2009)。传统的鱼类性成熟鉴定方法通常需要对个体宰杀后进行性腺的观察,很难在活体上进行操作。超声成像技术是无损鉴定鱼类繁殖过程的有效方法,且已经在 21 种鱼的繁殖研究中得以应用(Novelo et al,2012)。对于性腺较大的鱼类 [鲟类、大西洋鳕(Gadus morhua)和大西洋鲑(Salmo salar)]超声波对性别鉴定的准确率达 80%以上,然而,对于性腺较小的鱼类[杂交鲈、条斑星鲽(Verasper moseri)和红鳍笛鲷(Lutjanus erythropterus)等]性别鉴别比较困难。研究人员利用超声成像技术开发了早期发育阶段(2~3 龄)西伯利亚鲟(Acipenser baerii)的性别鉴定方法以及不同性腺发育阶段的判别方法,优化了西伯利亚鲟的亲鱼群体结构(Chebanov et al,2018)。挪威的 GreenFox Marine 公司于 2023 年开发了一种基于超声技术和人工智能的鲑鱼性别自动化解决方案,通过超声波探头摄取高分辨率的超声图像,人工智能模型仅需 0.03 s 分析并确定大西洋鲑的性别和性腺发育情况,且准确度维持在 97.00%~99.00% 之间,该设备每小时可自动鉴别 3 500 条大西洋鲑。
4.2 生理生化表型
生理生化表型涉及特定环境条件下鱼类各部位的功能,因此,其在应对环境胁迫中发挥着重要作用。在鱼类养殖过程中,确定鱼类的生理状态并在早期发现异常是确定鱼类健康状态的关键(Endo et al,2019)。然而,传统的测定鱼类生理生化指标的方法往往耗时长、方法不健全且涉及复杂的操作过程,因此,对鱼类生理性状的实时评估往往很难进行。
4.2.1 血液生理表型
近年来,基于生物传感器的测定方法在鱼类生理性状测定方面起着越来越重要的作用。皮质醇是研究鱼类是否处于胁迫状态的生物标志物(Pickering et al,1989),研究人员开发了一种利用葡萄糖氧化酶作为信号放大器的生物传感器来确定鱼血液中的皮质醇变化情况。结果表明,该生物传感器可以准确地定量描述血液中 1.25~200 ng/mL 浓度范围内皮质醇的变化情况,并表明暴露在空气中时鱼的应激反应最强(Wu et al,2019)。血液中葡萄糖的浓度也是研究鱼类胁迫反应的重要指示物(Endo et al,2019)。Wu 等(2015)设计了一款适合罗非鱼的无线生物传感器,该无线传感器可实时监测尼罗罗非鱼血液中的葡萄糖浓度及其在领土争端过程中的应激反应,为阐明尼罗罗非鱼的威胁行为与应激反应之间的关系奠定了基础。此外,血液中总胆固醇含量和乳酸含量等都可以作为判定鱼类健康与否的生理生化指标,相关的生物传感器也在研究当中(Takase et al,2014; Endo et al,2009)。在养殖过程中,确定雌鱼的排卵时间是收集高质量卵子的关键(Endo et al,2019)。在鱼类排卵过程中,其血液中 DHP 含量在卵子成熟阶段会迅速升高,这个现象可以帮助预测排卵时间。Hirai 等(2013)开发了一种测定 DHP 浓度的生物反应器,其在 15.6~50 000 pg/mL 的范围内可准确测定血液中的 DHP 含量(R2 =0.98),将该传感器应用于金鱼(Carassius auratus)排卵期的预测,结果表明,在金鱼排卵之前血液中 DHP 的含量迅速升高,可以用于排卵期的准确预测。
a:矢状面;b:冠状面;c:横断面;D:模型的 3D 视图(皮肤呈透明状)。每一种颜色代表一个独特的解剖器官。为了更好地显示其他器官,肌肉部分没有显示。
a: Sagittal; b: Coronal; c: Transverse planes through the3D interactive model; D: 3D view of the model (skin is rendered transparent) . Each color represents a unique anatomical organ. Muscles are not shown for better visibility of other organs.
4.2.2 体色表型
鱼类体色的变化在体温调节、紫外线防护、捕食者防御和捕食猎物等方面发挥着重要作用。此外,体色是养殖鱼类重要的经济表型特征之一,其不仅体现在色素的变化上,也会影响鱼类的生理和行为(Coulmance et al,2024; Svitačová et al,2023)。可见光成像在评价鱼类体色方面发挥着重要的作用。Wallat 等(2002)开发了一种彩色机器视觉系统(CMVS)并利用 R、G 和 B 三个参数对不同品种和不同饲料投喂的金鱼体色表型进行了定量描述。 Erikson 等(2008)利用数码相机获取了不同储存时间大西洋鲑的数码图像,利用机器视觉提取了大西洋鲑的体色特征并通过 L*、a*和 b*三个参数将体色量化。 Gümüs 等(2021)利用数码相机的图像结合标准色卡评估了欧洲鲶鱼和非洲鲶鱼不同发育阶段的体色,并利用 L*、a*和 b*三个参数将体色进行量化表征。豹纹鳃棘鲈(Plectropomus leopardus)的体色是影响其商业价值的重要表型,有研究利用显微镜观察结合图像识别的方式对其黑色体色和红色体色性状进行了表征,并结合重测序数据利用全基因组关联分析的方法确定了与其黑色体色相关的 SNP 位点 57 个(Tang et al,2023);与红色体色相关的 SNP 位点 10 个(Wen et al,2023),为豹纹鳃棘鲈体色的定向选育提供了依据。
4.2.3 器官生理表型
心脏功能是生物体生理机能的关键功能,心率及心率变化是衡量心脏功能的关键,然而,传统方式很难持续且有效地识别心跳生理的表型数据。Zabihihesari 等(2021)开发了一种微流体装置,可以成功获取斑马鱼幼鱼 94%的心跳生理学表型数据,为研究斑马鱼的心脏生理奠定了基础。基于 Tills 等(2018)前期研究成果,Ibbini 等(2022)开发了软件包 HeartCV,该系统可以对透明动物和胚胎的心率及心率变化等表型进行分析,目前已成功应用于玻璃海鞘(Ciona intestinalis)、卵萝卜螺(Radix balthica)和锯齿长臂虾(Palaemon serratus)等水生动物的胚胎发育表型监测。
4.3 产出表型
鱼类产出表型是指养殖生物量、饲料转化率和肌肉品质等方面的整体表现,是鱼类最复杂、养殖管理人员和育种人员最感兴趣的表型之一。这些复杂的表型通常遗传力较低,且是由多个数量性状位点结合养殖过程中各环节的环境因素共同作用决定的。通过高通量的获取和分析产出表型相关的大数据,并结合详细的环境因素,可以为解析产出表型的主效因素提供支撑。
4.3.1 生物量表型
生物量是评估鱼类养殖综合成效的关键指标,可以帮助养殖管理人员进行科学的渔业管理,然而,在集约化的水产养殖环境中,生物量信息的获取非常困难(Li et al,2020a; 李道亮等,2020)。鱼类生物量是指特定水域内鱼类的总数和鱼的平均体重的乘积(Harvey et al,2003),因此,生物量的评估主要为基于鱼类形态数据的体重预测和鱼类的计数两个方面。机器视觉、声学监测、环境 DNA 和电阻率技术法是高效无损原位评估养殖鱼类生物量特征的主要方法,在未来的发展中,基于以上方法的多技术信息融合可弥补单一技术方法的缺陷和短板,提高对目标识别的准确性(Li et al,2024a; 2024a、 2020b; 李道亮等,2020)。此外,有研究表明,通过利用二极管框架结合被动集成应答器(PIT-tag)实现了对深海网箱养殖大西洋鲑生物量的无损测定,在群体水平上,该方法对大西洋鲑长度平均预测差异为 0.002%,体重的平均预测误差为 4.00%;在个体水平上长度和体重的平均预测误差分别为 0.54% 和 4.50%,该方法表现出很高的预测精度(Difford et al,2020)。这种二极管框架的测定方法有望实现对海区中养殖鱼类成效的连续监测。
4.3.2 肌肉品质表型
肌肉是鱼体最大的组织器官,也是人们关注鱼类产品质量及其品质特性之所在。肌肉品质相关的性状,比如色泽、纹理、脂肪酸组成,Ω-3 含量和出肉率等也都是鱼类的产出表型,影响鱼类的生产过程和商品价值(Wang et al,2019; Xia et al,2014; Gjedrem et al,2010)。大多数情况下,肌肉品质相关的性状通常需要对个体宰杀后进行测量,很难在活体上进行操作,这样不仅会耗费大量的时间和人力,而且这种破坏性的方法很难高通量地开展(Baranski et al,2010)。随着传感器技术的发展,包括高光谱成像、micro-CT、核磁共振和超声波等表型获取技术结合深度学习和机器学习方法,搭配自动的记录程序将更有效地获取鱼类肌肉品质相关的表型性状。 Zhang 等(2020)利用高光谱成像技术(900~1 700 nm)结合机器学习方法评估了大西洋鲑鱼肉中的含水量和脂肪含量,表明光谱特征和纹理特征的融合算法可以提高大西洋鲑鱼肉含水量和脂肪含量的精度,其含水量和脂肪含量的预测精度均高于 0.96。Wang 等(2022) 利用高光谱成像技术(400~1 000 nm)结合人工神经网络算法准确预测了大黄鱼(Larimichthys crocea)鱼肉颜色的变化情况(R2 >0.90)。Cao 等(2023)利用 400~1 000 nm 高光谱成像结合不同机器学习方法分别评估了活体鲤(Cyprinus carpio)4 个不同部位肌肉的弹性、硬度、脆性等 8 种质构表型和肌肉中不饱和脂肪酸的含量。结果表明,高光谱成像技术结合优化模型可以快速准确地确定鲤不同区域肌肉的品质性状,对肌肉中不饱和脂肪酸含量的预测也表现出优异的性能(R2 >0.99)(Cao et al,2024)。Lintvedt 等(2023)分别利用拉曼光谱和高光谱成像即时分析了大西洋鲑鱼肉中脂肪酸的组成和含量,结果表明,两种成像技术都能对大西洋鲑鱼肉中 EPA 和 DHA 含量进行预测,其中拉曼光谱的预测稳定性更高。
鱼片脂肪含量是评价鱼片品质和胴体质量的重要指标,利用 micro-CT 技术可对鱼体的脂肪含量和出肉率等表型进行精准测定并建立脂肪组织的 3D 分布模型,为养殖鱼类的脂肪含量无损快速评价和脂肪分布的可视化提供了可行的技术手段(Wang et al,2021; Maas et al,2020)。此外,通过 micro-CT 技术可以评价鱼类肌肉中的炎症情况及动态发展变化,为非侵入式研究鱼类肌肉炎症情况提供了参考(CamposSánchez et al,2022)。
MRI 也是评价鱼类肌肉品质的有效方式。1H 和 23Na 是 MRI 在鱼类研究中最常用的核原子团,其在肌肉中水分和盐分的含量、状态以及迁移变化研究中发挥着重要作用(Lang et al,2023; Zhang et al,2023; Li et al,2018; Mathiassen et al,2011)。MRI 还可用于鱼类肌肉脂肪含量的无损评估。Wu 等(2015)首次利用 MRI 构建了定量整个鱼类脂肪组织总体积的三维图像,确定了草鱼(Ctenopharyngodon idella)、罗非鱼、大黄鱼、大菱鲆(Scophthalmus maximus)和卵形鲳鲹(Trachinotus ovatus)等鱼类的脂肪组织分布模式,通过传统解剖法证明 MRI 在评估鱼类脂肪组织体积精确度与传统解剖法的结果高度一致。Tawara 等(2022)利用 MRI 对五条
(Seriola quinqueradiata)的品质进行评估,表明 MRI 在研究五条
的脂肪分布、水分扩散和筋膜密度等方面有巨大的潜力。
(Seriola quinqueradiata)的品质进行评估,表明 MRI 在研究五条
的脂肪分布、水分扩散和筋膜密度等方面有巨大的潜力。
超声成像同样常用于鱼类肌肉脂肪含量的评价。结合不同的机器学习方法和图像处理软件,超声波可用于竹荚鱼(Trachurus japonicas)(Tokunaga et al,2020)、鲤(Maas et al,2019)和塞内加尔鳎(Solea senegalensis)(Silva et al,2016)等鱼的肌肉脂肪含量的精准检测。
4.3.3 饲料转化率表型
在水产养殖中,饲料成本约占据养殖总成本的 50.00%~75.00%,因此,饲料转化率是鱼类的重要经济性状。鱼类饲料转化率的测定方法与陆生动物并不相同,因为每条鱼的摄食情况很难精准测定,传统方法需要对每条鱼进行单缸饲养,且每条鱼每天的采食量并不一致。法国一研究团队开发了测量鱼类饲料消耗情况(如采食量、饲料转化率和剩余采食量)视频评估系统,并对 40 个 GIFT 品系的尼罗罗非鱼纯种家系的每条鱼、每次摄食的视频记录分析,通过计算个体每次喂食的摄食数量评估了生长性状、采食量、饲料转化率和剩余采食量等性状的遗传力(De Verdal et al,2018)。然而,这个方法的复杂性仍是需要解决的问题,比如鱼的喂食需要一粒一粒地进行;视频数据的分析需要很长的时间;存储这些食品数据也需要巨大的存储空间。
此外,基于 X 射线成像的图像识别方式也是研究鱼类日采食量的有效方法。研究人员利用 X 射线结合玻璃珠法研究了大鳞大麻哈鱼(Oncorhynchus tshawytscha)的日采食量,该方法得到的饲料转化率数据与其他研究中传统方法测量得到的大鳞大麻哈鱼饲料转化率数据具有较高的一致性,利用以上表型数据,该研究估计了大鳞大麻哈鱼日摄食量的遗传力为 0.18~0.20(Scholtens et al,2023)。Difford 等(2024) 利用 X 射线技术获取了 700 条大西洋鲑个体的采食量表型,表明 X 射线方法与传统方法测定的大西洋鲑进食量的相关性为 0.78~0.82,据此估计了大西洋鲑日采食量的遗传力为 0.19±0.06。
4.4 行为表型
鱼类行为分析是水产养殖的重要组成部分,鱼类行为的变化能够体现其应对环境变化的反应。因此,分析鱼类行为表型可以有效地评估鱼类福利、渔业和生态系统的变化(Zion,2012)。鱼类行为表型主要包括摄食行为表型、群体行为表型、异常行为表型和繁殖行为表型等(Fu et al,2022; Li et al,2020b)。
4.4.1 摄食行为表型
鱼类的摄食行为分析是水产中摄食优化的重要组成部分,关于鱼类摄食行为表型特征的获取多基于机器视觉结合人工智能的方法(Li et al,2020a)。将传统的机器视觉与支持向量机相结合,通过分析鱼类的行为可以确定鱼是否被主动喂食(AlZubi et al,2016)。利用鱼群的分散、相互作用力和水流场变化程度也可以定量表征鱼群食欲(Zhao et al,2017)。Zhou 等(2019)提出了一种基于卷积神经网络的系统,将鱼的摄食强度分为 4 个等级,且分类精度>90.00%。Måløy 等(2019)利用 CNN 和 LSTM 两种深度学习模型结合图像识别预测大西洋鲑的摄食和非摄食行为,准确率达到了 80.00%。Adegboye 等(2020)开发了一种人工神经网络系统,该系统基于鱼类振动分析的鱼类摄食行为,结果表明,当傅里叶描述阈值为 0.50 时,该系统对摄食行为评估的准确率为 100%。Yang 等(2021)开发了一种基于 EfficientNet-B2 双重注意力网络的斑石鲷鱼群短期摄食行为识别系统,对斑石鲷摄食行为表型的识别准确度为 89.56%。隋金柱(2023)基于机器视觉技术对珍珠龙胆石斑鱼(Epinephelus fuscoguttatus♀×Epinephelus lanceolatus♂)的摄食行为进行了研究,结果表明基于改进 MobileNetV3 模型对珍珠龙胆石斑鱼摄食强度的评估准确率达 97.10%。
4.4.2 群体行为表型
鱼类群体作为一个整体,具有显著的协调性和适应性,并通过成员的相互吸引自发地维持下去(Zhao et al,2021)。鱼类群体行为可以提供更深入的环境或群体社会变化信息(Han et al,2020)。Han 等(2020)提出了一种基于 CNN 和时空信息融合的群体行为识别方法,用于识别鱼类的 6 种群体行为,且识别准确率为 82.50%。Zhang 等(2019)基于 VGG-16 网络对斑马鱼种群进行识别,通过计算正常状态和异常状态的熵来确定鱼群行为,模型的准确率为 91.93%。
4.4.3 异常行为表型
鱼类的异常行为(如攻击行为)常常发生在相对较小的区域内,因此,对异常行为的定位和识别是描述鱼类异常行为的关键。Zhao 等(2017、2018)开发了基于 RNN 的集约化养殖鱼群异常行为检测方法,可对鱼类群体的局部异常行为进行识别,该方法对鱼类异常行为的平均检测准确率为 89.89%。
虽然计算机视觉技术在鱼类行为学研究中得到了广泛的应用,但是,该技术易受到养殖密度、光照和养殖水环境浊度的影响,声学研究提供了一种可以替代计算机视觉的可行性方案,不仅可以在光环境较差的环境中有效获取水下环境信息,不会对鱼类造成额外的胁迫,而且能够提供类似视频效果的鱼类行为观察(Guerneve et al,2018; Li et al,2024a)。此外,声学技术在研究高密度养殖群体的游泳行为方面有着独特的优势,目前已应用于网箱养殖的大鳞大麻哈鱼(Oncorhychus tshawytscha)、虹鳟、大西洋鳕、大西洋鲑和金头鲷(Sparus aurata)等鱼类等行为评估(Li et al,2024a)。
4.4.4 繁殖行为表型
被动声学监测是监测有声水生动物繁殖活动的有效方法,长期的被动声学监测有助于理解和监测有声鱼类的繁殖行为。首先通过水听器采集水中鱼类的声信号,采用傅里叶变换等方法对音频进行可视化,利用不同的统计方法对音频文件进行分析,然后通过定量分析不同音频的特征参数(如单位时间内音频出现的次数、声压级和音频出现的时长等)的变化规律,识别鱼类声学特征与繁殖行为之间的关系(Li et al,2024a)。研究表明,鱼类的特定叫声和产卵时间之间存在显著相关性,利用机器学习或深度学习的方法可以实现基于鱼类叫声的繁殖行为分析。目前被动声学监测方法已应用于石斑鱼、蟾鱼和石首鱼类等产卵和繁殖行为研究(Montie et al,2017; Ibrahim et al,2018a、b; Bolgan et al,2020)。
4.5 其他重要的表型性状
4.5.1 胚胎发育表型
胚胎发育是鱼类发育过程中的重要阶段,是一个动态变化的过程。传统观察胚胎发育的方法往往是利用显微镜定时对胚胎发育过程进行拍照分析,然后通过观察确定胚胎发育阶段(Yang et al,2021)。鱼类胚胎发育包含了个体内部广泛的时间、空间和功能尺度的变化,这意味着传统的方法不可能在个体水平上对其表型性状进行详尽的量化(McCoy et al,2023a、b)。此外,除了个体内部的变化外,胚胎的发育也表现出很强的个体间差异,因此,对胚胎研究的最佳方法是高通量且自动地对胚胎进行连续的观察(Tills et al,2018)。第一个系统的胚胎发育表型筛选于 20 世纪 90 年代早期在斑马鱼中开展,重点研究了斑马鱼中囊胚转换后发育过程中 400 多个基因中的 1 500 个突变,报告了大量新的突变表型(Fuentes et al,2018)。此后,研究人员开发了一种开源的胚胎表型组学研究系统,可以高通量地研究水生生物胚胎学的表型性状,该系统包括一个高分辨率的视频显微镜(OpenVIM)来获取不同环境条件下多个胚胎的高分辨率视频,视频内容可用搭配的 python 软件包 EmbryoCV 进行自动分析,该软件包可以提取胚胎发育过程中的形态、生理、行为和代谢特征等表型数据(Tills et al,2018)。该表型组研究系统已在卵萝卜螺(Radix balthica)(Tills et al,2021、2018)、跳钩虾(Orchestia gammarellus)(Tills et al,2018)、锯齿长臂虾(Palaemon serratus)(Tills et al,2023)、静水椎实螺(Lymnaea stagnalis)和尖膀胱螺(Physella acuta)(McCoy et al,2023b)等水生生物的胚胎发育表型组研究中得以应用。Moses 等(2023)设计了一套高通量的表型获取系统研究 3 种肽类激素在弗氏假鳃鳉(Nothobranchius furzeri)发育过程中对生长和性腺发育表型的影响,研究发现,不同激素调控对体细胞的生长和繁殖产生不同的重叠效应,但其发育仍然遵循脊椎动物的保守程序。
4.5.2 抗病抗逆表型
水产疾病和虫害是水产养殖业中面临的重大挑战,往往会给水产养殖业造成巨大的经济损失。然而,传统识别方法对于水产养殖过程中受感染的鱼类的早期识别仍具有挑战性,图像处理技术和计算机视觉技术的结合为鱼类病害的智能诊断提供了新方法(Li et al,2022)。Ahmed 等(2022) 基于机器视觉和支持向量机分类开发了一种对大西洋鲑疾病的分类模型,成功地对健康和患病的大西洋鲑进行了分类,分类准确度达 94.12%。Mia 等(2022) 开发了一种深度自动化的鱼病识别方法,该方法采用 K-means 聚类算法提取了数码图像中的疾病特征,并结合随机森林对患病的鱼类图像进行识别,其准确度为 88.87%。Cai 等(2024)在原始的 YOLOv7 算法中引入 NAM Attention 机制和 ELAN 模块,提高了对鲤春季病毒血症病(spring viremia of carp virus)的预测精度,优化后的模型对该病的识别精度超过 95.00%。此外,高光谱成像、荧光成像、超声成像和生物传感器在鱼类疾病的高通量识别中也有独特优势(Li et al,2022)。虽然图像处理结合机器视觉技术在鱼类疾病的识别中发挥了很好的作用,但在目前养殖环境下疾病的暴发和快速传播可导致鱼类在短时间内大规模感染,发现鱼类疾病后仍需立刻采取隔离病鱼、鱼体消毒、投喂药物、环境消杀等方式进行补救,如处理不当会导致鱼类大量死亡和水体污染,造成巨大的经济损失。因此,抗病抗虫的新品种或者新品系在水产养殖中更受欢迎。然而,获得具有抗病性状的鱼类种质仍非常困难(Liu et al,2016; Ødegård et al,2011; Wang et al,2017)。传统方法为了描述每条鱼对病原的耐受程度,往往需要培养特定的病原体并进行攻毒实验,通常需要在整个攻毒周期中记录鱼类的存活率、死亡率以及存活时间等数据(Wang et al,2017)。目前仍没有相关评价鱼类抗病等级的高通量研究方法。此外,在攻毒实验中表型获取的主要在于在可控环境下进行实验,这种环境条件下测量的表型与养殖环境中测量的一致性可能不够高。在此情况下,基于实验环境所选育出的抗病抗虫种质的准确性就会降低。
抗逆性也是鱼类重要的表型性状,但目前还没有关于抗逆性表型的统一标准和指标。确定鱼类对盐度和温度的抗逆性可以通过将其分别置于不同盐度和温度的逆境中进行抗逆性实验,通过对死亡率、生长、生理和行为等表型的综合分析和判断,筛选具有抗逆性的鱼类种质资源。
5 鱼类表型组研究存在的问题
鱼类表型组研究因其高通量、非入侵且精确的优势,在鱼类种质资源开发利用及解析鱼类对环境的响应和适应机制方面展现出较大应用潜力,其研究的紧迫性和必要性也越来越被认可与接受。虽然研究人员在鱼类表型组学研究中开展了一系列工作,但其研究过程中仍存在一些问题。
(1)表型组学研究的概念仍需统一。虽然表型组学已经发展多年,但对其准确的定义和研究内容仍不是很清晰,目前对其概念存在多种不同的解释(Zavafer et al,2023)。此外,表型组的研究内容与基因组、转录组、蛋白质组和代谢组的研究内容有重叠的部分。对于生物体来说,表型特征是无限的,因此,表型组研究对应的是一个很大的数据库,然而,不是所有具有大数据库的表型特征都是表型组研究,必须通过设计有效的实验方案,关注有重要意义的表型特征,并结合产生这些表型的相关环境条件进行分析,这样才能实现表型组研究与生产实践的有效结合。
(2)鱼类表型组学研究平台和组织机构仍需完善。针对不同对象的表型组研究发展进程并不相同,其中人类表型组最为重要,植物表型组发展的最为完善(张永卓等,2022)。目前,在植物表型组研究中已经开发了多种智能化高通量的表型研究平台,如 TraitMill、PHENOPSIS、GROWSCREEN、Scanalyzer3D 和 HRPF 等,这些平台结合不同的传感器,可采集不同的表型特征,实现了全生活周期、全植株形态和全栽培尺度的植物表型组研究体系。然而,目前鱼类表型数据依然以“点”数据为主,很难反映表型性状时空尺度的发育,也不能准确揭示群体水平的变化。此外,植物和人类表型组研究中形成很多组织机构进行大规模植物表型组的分析和研究,如国际植物表型网络(IPPN)、欧洲植物表型网络(EPPN)、澳大利亚植物表型研究所(APPF)、欧洲成立为应对气候变化的多尺度表型研究和食品安全模拟分析的欧洲基础设施(EMPASIS)以及国际人类表型组项目(IHPP)等。这些机构和组织不仅为表型组学研究提供了交流平台,也为表型研究者提供了技术和数据支持。而在鱼类表型组研究中,尚缺乏类似的表型组综合研究体系和相关的研究组织。
(3)不同尺度的鱼类表型组研究平台仍需开发。高通量且准确地获取表型特征是鱼类表型组研究的关键环节,然而,鱼类养殖的方式多样(包括池塘工程化、陆基工厂化、近海网箱、深远海网箱、养殖工船等多种养殖方式),表型组研究在不同应用场景的精确度仍存在较大差异。高密度集约化的养殖方式是我国鱼类养殖的发展方向,在高密度且不断运动的条件下,如何高效地进行个体识别并且对表型进行高通量精确地获取仍是鱼类表型组研究的难点。虽然各种高分辨率传感器技术与人工智能的发展为鱼类表型组研究提供了前所未有的机遇,目前的研究方法仅对麻醉后静止的或养殖密度较低的鱼类个体表型获取的精度较高,模型的预测效果较好;但对处于高速游泳状态且高密度的养殖群体,仍难以实现精准的个体表型获取(Li et al,2024b)。
(4)鱼类表型组数据的挖掘和分析方法仍亟需开发。高通量且准确的表型分型技术是表型组研究的重要组成部分,但目前大量的研究人员将表型组研究的重点集中于高通量表型分型技术的研究,导致开发了大量的表型获取方法,这些类似的方法产生了大量的表型数据。近年来,深度学习等机器学习方法已被证明在对海量数据进行分类和回归分析方面具有强大的能力,但它是一个黑箱预测器,提取的特征通常缺乏对其生物学意义的解释。如何从海量的表型信息中进行有效的数据挖掘,使其能够更好地解释生物学现象和意义是表型大数据分析的核心(赵春江,2019)。不同的方法虽然提高了表型获取的精度和通量,但这些表型数据集后续并没有与相关的环境因素和生物学问题相关联,导致很多数据的浪费。此外,目前的鱼类表型分型方法仍主要集中于如大西洋鲑、虹鳟和鲤等少数几种特定的经济鱼类中,仍缺乏针对其他经济鱼类的高通量表型分型方法(Fu et al,2022)。
(5)鱼类表型组学数据的规范化和标准化仍需推进。研究人员在鱼类表型组研究中已经开展了很多的工作,但大多数工作是基于各研究团队的自身情况开展,有着各自独特的表型研究方法,缺乏表型特征采集的标准化方法和流程,导致已得到的表型数据存在精度差异大、配套信息不完善和数据可重复性差等诸多问题。如何将各个团队采集和分析的大量表型数据进行整合和共享是后续鱼类表型研究所面临的挑战。此外,植物中已经建立了 Planteome、BreedingAIDB、 RFGB 和 LettuceDB 等多个涵盖表型组学特征的数据库,也建立了全球人类表型组数据库(Phenobank),而目前并没有可以存储和整合鱼类表型特征的数据库。
6 鱼类表型组的应用前景
(1)多学科交叉协作是表型组研究的前提。表型组研究涉及对生物体整个生命周期,甚至复杂生存条件下各维度表型的高通量、自动化和精确的感知和获取。在此前提下,多学科的交叉合作在鱼类表型组研究中将尤为重要。未来的鱼类表型组学研究应发挥生命科学、信息科学和工程科学等不同学科间的优势,针对不同鱼类独特的表型特征,结合不同的养殖模式进行跨学科协作研究,集成形成适合鱼类表型组研究的低成本、高通量、多尺度、多维度、多模态和多环境条件的大数据表型获取系统,将鱼类表型组研究应用于养殖鱼类生产实践的各个环节。
(2)标准化的数据是表型组研究交流和共享的基础。数据集和数据库是基于数据驱动的人工智能方法的核心,鱼类的表型组研究需要大量高质量的表型数据来训练和验证人工智能模型。随着表型数据的不断积累,开发表型获取和分析的标准是在多个学科中更好地利用表型数据的关键。后续鱼类表型组研究应不断收集和整理鱼类表型数据,规范表型数据的采集方法和流程,形成鱼类表型数据采集标准,为表型数据库建立、表型数据共享和人工智能新算法的开发奠定基础。此外,未来数据库应尽可能多地包含不同种鱼类、不同生长发育阶段、不同环境下的表型数据特征,以及不同时空条件的鱼类个体和群体数据,以供不同研究人员训练泛化能力更强和应用范围更广的模型。
(3)多模态数据融合是提高表型组研究准确性的重要途径。鱼类的表型涉及多种感知模态,如光学、声波、生物传感器等,融合多种模态数据可以获得更为丰富、全面且精确的表型特征。然而,现阶段的研究大部分是基于单一模态进行的表型研究,且各模态的表型数据相对独立,如何将多模态数据融合起来,以提高表型数据获取准确性和鲁棒性是未来鱼类表型组研究发展的重要方向。人工智能技术的发展为表型组数据的多模态融合提供了广阔的前景,未来可以利用多模态的深度学习方法对不同模态的表型特征进行综合学习和分析,增强不同模态表型组数据的统一性。
(4)有效的研究组织和学术交流是促进鱼类表型组研究快速发展的重要手段。鱼类表型组研究的产业链包括养殖育种企业、研究机构、表型鉴定公司、政府机构等,汇集不同学科专业人才的研究组织可为鱼类表型组研究提供一个链接各种有效资源的网络。后续建议成立聚焦鱼类表型组研究的相关非盈利性组织机构,加强鱼类表型组研究人员之间以及鱼类表型组研究与产业间的交流与合作,以产业需求为导向,将研究成果转化为产业效益。




