Нажмите "Enter", чтобы перейти к контенту

Сравнение генерируемых компьютерным и патологоанатомическим сегментами опухолей для иммуногистохимического скрининга микрочипов молочной железы

Comparing computer-generated and pathologist-generated tumour segmentations for immunohistochemical scoring of breast tissue microarrays
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4651129/

Тканевые микрочипы (ТМА) стали ценным ресурсом для экспрессии биомаркеров в трансляционных исследованиях. Иммуногистохимическая (IHC) оценка TMA является основным методом анализа большого количества образцов пациентов, но ручная оценка IHC TMA остается сложной и кропотливой задачей. Благодаря достижениям в анализе изображений компьютерный анализ TMA может уменьшить нагрузку на обзор экспертного патологоанатома.

В текущем коммерческом программном обеспечении компьютеризированный подсчет рецепторов эстрогенов (ER) основан на локализации опухоли в виде аннотаций, полученных вручную. В этом исследовании была оценена локализация опухоли для оценки ER по сравнению с компьютерными сегментационными масками с таковыми у двух специалистов-патологов. Автоматически и вручную полученные макеты сегментации использовались для получения баллов по шкале IHC для тридцати двух образцов ТМА с инвазивным раком молочной железы с использованием FDA с одобренным FDA программным обеспечением для оценки IHC.

Хотя сравнение на уровне пикселей показало более низкое согласие между автоматическими и ручными сегментационными масками (κ = 0,81), чем между масками патологоанатомов (κ = 0,91), это мало повлияло на рассчитанные оценки IHC (Allred = 0.91, Quickscore; = 0.92).

Предлагаемая автоматизированная система обеспечивает согласованные измерения, обеспечивая тем самым стандартизацию, и показывает перспективы для увеличения IHC-анализа ядерного окрашивания в TMA из крупных клинических испытаний.

С улучшением клинических исходов у женщин, получавших лечение рака молочной железы, так что 5-летняя выживаемость теперь приближается к выживанию на 90% и 10 лет на 80%, адъювантные клинические испытания требуют очень большого числа пациентов и образцов тканей для исследований биомаркеров для изменения изменений в клинической практике. Многие такие крупные клинические испытания перешли к созданию микрочипов тканей (TMAs, Ilyas et al, 2013), чтобы ускорить процесс идентификации и анализа биомаркеров, для которых пациенты будут или не будут пользоваться определенной терапевтической стратегией. Такие ТМА могут содержать несколько сердечников ткани от каждой опухоли диаметром 0,6-1,0 мм с смесью опухолей, нормальных и других тканей, включенных в ядро.

Хотя иммуногистохимическое (IHC) окрашивание или молекулярный анализ одного слайда TMA с представлением от 20-40 пациентов и нескольких образцов на пациента является эффективным использованием ткани человека, антител и лабораторных процессов, остается проблема квалифицированного обнаружения и оценки биомаркеров , Такое считывание статуса биомаркера требует много времени и требует много времени, требуя экспертной оценки. Таким образом, все больше внимания уделяется возможности автоматизированного считывания слайдов биомаркеров груди TMA, а не полагаться на обзор патологии (Madabhushi, 2009). Тем не менее, признав, что экспертный экспертный обзор патологоанатома молочной железы является «золотым стандартом» для интерпретации биомаркеров, таких как рецептор эстрогена (ER) при раке молочной железы, любой автоматизированный подход должен быть сопоставим с такой экспертной оценкой.

В предыдущих исследованиях, сравнивающих автоматические и ручные оценки IHC (Arihiro et al, 2007; Fasanella et al, 2011; Rizzardi et al, 2012), оценки проводились на основе измерений, полученных после анализа клеток. Однако узкое место в современных алгоритмах анализа изображений заключается в том, чтобы отличить здоровые от раковых тканей (Gurcan et al, 2009). В контуре цифровой патологии локализация опухолей имеет важное значение для фокусирования скоринга клеточных белков на конкретные интересующие области. Он обычно выполняется как этап предварительной обработки, при котором оператор отслеживает области опухоли вручную. Однако прогресс в анализе изображений за последнее десятилетие открывает перспективы использования машин для автоматического обнаружения опухоли в изображениях тканей с небольшим или вообще отсутствием вмешательства человека. В этом исследовании мы показываем преимущества использования такой системы. Система, принятая здесь, была разработана для работы на ряде ядерных, цитоплазматических и мембранных биомаркеров. Мы используем ядерное пятно IHC, ER, в качестве примера, и сообщаем о сравнении между специалистами-патологами и компьютерными подходами к оценке IHC.

ER был выбран в качестве примера, поскольку он является наиболее распространенной мишенью для IHC при раке молочной железы, обеспечивает явное ядерное окрашивание антителами в клиническом применении и является основой для оценки IHC с клинической и исследовательской полезностью. Таким образом, ER представляет собой хороший образец для тестирования методологических подходов, используемых здесь.

В этом исследовании ручные сегменты воспроизвели точный способ, с которым патологи взаимодействовали с широко используемым FDA-одобренным алгоритмом оценки IHC. В частности, были сопоставлены оценки IHC ER Allred (Allred et al, 1990) и Quickscores (Detre et al, 1995) с компьютерных и вручную полученных сегментных масок. Здесь мы сообщаем о разработке и оценке такого программного обеспечения и о возможной универсальности подхода.

Травмы груди были получены в исследовательских целях от первичных, ранее необработанных форм рака молочной железы, используя избыточные ткани из обычной клинической практики после письменного информированного согласия пациентов-доноров. Этическое разрешение было предоставлено Tayside Tissue Bank, Данди, Великобритания, в соответствии с полномочиями Комитета по этике исследований Тайсида. Короче говоря, хирургический резецированный первичный рак молочной железы у пациентов с невыбранным заболеванием фиксировали в буферизованном формалине, хранящем при контролируемой температуре (18-22 ° C) в течение ночи и обрабатывали до фиксированных формалином блоков, содержащих парафин. Целые монтажные секции, окрашенные гематоксилином и эозином, были отмечены, чтобы выделить соответствующий инвазивный рак или нормальную ткань, чтобы обеспечить образование ТМА до шести ядер 0,6 мм на один рак. Затем ТМА были построены с использованием ручного тканевого аппарата (Beecher Instruments Inc., Sun Prairie, WI, USA). Четырехкомпонентные секции TMA разрезали, устанавливали на стеклянные слайды с покрытием из поли-L-лизина и подвергали окрашиванию для локализации ER-альфа (6F11, 1: 200, Novocastra Laboratories Ltd). Окрашенные слайды были сканированы с сжатием с потерями с использованием Aperio Scanscope XT (Aperio Technologies, Vista, CA, США) по объективу × 20 с оптическим удвоителем на месте (что эквивалентно оптической цели × 40). Каждый слайд затем сегментировали в отдельные составляющие окрашенные пятна, причем каждое пятно представляло собой участок из тканевого ядра.

Использовались тридцать два несжатых формата TIFF изображений пятен TMA из тридцати двух раков груди. Периметр каждого пятна был очерчен, а пиксели, внешние по отношению к этому периметру, были исключены из последующего анализа. Каждое пятновое изображение было ~ 3000 пикселей в диаметре и содержало инвазивный рак.

Области опухолей в пятнах TMA были вручную сегментированы с использованием программного обеспечения Aperio Technologies Spectrum с TMA Lab и интерфейсом Webscope (Aperio Technologies). Сегментация включала в себя вручную отслеживание границ областей инвазивных опухолей на планшете Wacom Bamboo Fun (модель CTH-461) с использованием стилуса для точности; программный инструмент отображал заполненные области, наложенные на пятновые изображения TMA, поскольку они были аннотированы. Каждое пятно было аннотировано независимо двумя специалистами-патологами-патологами (патологоанатом А и патологом В), в результате чего были созданы два набора опухолевых масок. Пиксели в каждой маске были помечены как опухоль (T), так и неопухолевая (N). Каждое пятно принимало в среднем 23 мин для аннотации каждого патологоанатома; однако задача аннотации TMA была распространена в течение нескольких дней.

Программное обеспечение, реализующее алгоритм анализа изображения, использовалось для сегментации областей опухоли автоматически с использованием алгоритма, описанного в дополнительном материале 1. Этот алгоритм использует кластеризацию для группировки пикселей в компактные области, называемые суперпикселями, так что границы ячеистых компактов имеют тенденцию лежать на границах суперпикселей. Затем был использован метод машинного обучения для маркировки каждого суперпикселя как опухоли, так и неопухоли, основанного на его цвете, форме и визуальной текстуре, а также сходных свойств от близлежащих суперпикселей. Алгоритм был обучен с использованием набора полученных вручную сегментов.

Каждое из тридцати двух пятен в наборе данных было автоматически сегментировано дважды, используя алгоритм, подготовленный по мануальным сегментационным маскам патологоанатома А, и один раз с использованием алгоритма, подготовленного по мануальным сегментационным маскам патологоанатома B. В каждом случае использовалась 8-кратная экспериментальная схема перекрестной проверки. В каждой сцене обучение занимало в среднем 30 минут на процессоре Intel Core i7-2600K; оптимизация этого кода может еще больше сократить время обучения.

Каждая ручная маска сегментации каждого пятна сравнивалась друг с другом и с компьютерными масками сегментации, сравнивая метки (T или N), назначенные каждому пикселю. При сравнении меток пикселей в двух масках есть четыре возможности: (T, T), (T, N), (N, T) и (N, N). Тем не менее, существуют качественные различия между сегментированными регионами, которые недостаточно хорошо запечатлены путем простого подсчета количества пикселей, которые попадают в каждую из этих четырех категорий. Поэтому при сравнении двух масок сегментации мы классифицировали разногласия с меткой пикселей на три типа следующим образом (рис. 1, см. Дополнительный материал 2 для кода).

Тип 1: границы областей в двух сегментационных масках часто разделяются вдоль части их длин на расстояния всего в несколько пикселей. Такие расхождения могут возникать из-за отсутствия точности при использовании стилуса и / или из-за отсутствия какой-либо четкой визуальной границы для аннотации изображения. Как таковые они, вероятно, будут несущественными для последующих задач, таких как подсчет IHC, поскольку такие небольшие выделения не позволяют включить или исключить целые клетки.

Тип 2: разногласия, не относящиеся к типу 1, достаточно велики, чтобы охватить эпителиальные клетки (рис. 1). Несогласие пикселей помечено как Тип 2, если оно не относится к типу 1, и оно находится в области, обозначенной как T в одной маске, которая перекрывается с областью, помеченной как T в другой маске. Разногласия типа 2 могут возникнуть из-за различий во мнениях относительно пространственной протяженности области опухоли.

Тип 3: Разногласия, не являющиеся ни 1-м, ни 2-м типом, обозначаются как Тип 3, что отражает различия во мнениях относительно того, является ли группа клеток злокачественной.

Типы разногласий визуализировались путем вычисления разностных изображений из пар масок сегментации, а затем пикселов цветного кодирования, для которых сегментации отличались как Тип 1, Тип 2 или Тип 3 (Рисунок 2).

Утвержденный FDA алгоритм Aperio IHC Nuclear Version 10 (Aperio Technologies) использовался для оценки показателей ER на основе полученных масок сегментации. Только регионы, помеченные как опухоль (Т), были переданы алгоритму подсчета очков. Алгоритм Aperio IHC автоматически идентифицирует ядра и выводит показатель интенсивности окрашивания (от 0 до 3) и оценку процента положительно окрашенных клеток. Из этих измерений оценки IHC (оценка Allred и Quickscore) были рассчитаны для ручных и автоматически полученных сегментных масок. Сообщается о сравнительных оценках того, в какой степени различия в этих сегментациях повлияли на скоринг.

При сравнении на уровне пикселей ручных масок с отрисовкой вручную патологоанатомы отличались своей маркировкой 9% пикселей (таблица 1). Автоматизированные сегментирующие маски были подготовлены путем обучения либо патологоанатомам А, либо патологоанатомам Б. Сравнение сегментов руководства каждого патологоанатома с полученными автоматически выявляло разногласия в 19% пикселей. Разногласия были сходными между ложными срабатываниями (N, T) и ложными негативами (T, N).

Когда были отображены распределения соглашений и разногласий (рис. 3), наблюдались некоторые вариации (табл. 2). Из тех пикселей, которые по-разному были отмечены двумя патологами, 23% разногласий были типа 1, поэтому, вероятно, не повлияли на оценку ЭР. Соотношение разногласий, которые были Типом 1 при сравнении автоматического с ручными сегментами, было несколько выше (27%). Распределение разногласий по остальным типам (тип 2 и тип 3) было в целом сходным, будь то сравнение руководства с автоматической сегментацией или руководство с ручной сегментацией. Хотя средняя доля разногласий типа 3 была выше между ручными сегментами (18 ± 23%) по сравнению с автоматизированными сегментами (11 ± 12%), с.д. было достаточно, чтобы указать большие различия между оценками пятен TMA.

Показатели интенсивности и процент положительных клеток измеряли с помощью ядерного алгоритма Aperio IHC (Aperio Technologies), когда он снабжался сегментами опухолей. Также оценивали процент положительных ER-клеток, вычисленных Аперио (рис. 4). Договоры между оценками, рассчитанными в Аперио, сообщались отдельно по интенсивности, а оценки доли Allred и Quickscore в терминах статистической статистики по шкале Каппы с двумя критериями (Cohen, 1968) (таблица 3). Договор между патологоанатомами составил 0,96 для оценки интенсивности и 0,97 и 0,99 для показателей доли для Allred и Quickscore соответственно. Для сравнения, автоматизированные сегменты в среднем составляли соглашения 0,89 для оценок интенсивности и 0,85 (Allred) и 0,87 (Quickscores) для показателей доли.

Согласование итоговых баллов Allred и Quickscores было рассчитано путем суммирования показателей интенсивности и пропорций. Сравнение автоматических и ручных сегментных масок приводило к средним соглашениям 0,91 (Allred) и 0,92 (Quickscore) (Таблица 4; Рисунок 5).

Это исследование касалось необходимости автоматического опроса ТМА с использованием ядерного окрашивания ER первичного рака молочной железы в качестве примера. Хотя предыдущие исследования показали, что анализ изображений может увеличить рабочий процесс и уменьшить вариабельность между и внутри наблюдателя (Gurcan et al, 2009; Veta et al., 2014; Rohde et al., 2014), здесь мы оцениваем новое программное обеспечение для анализа изображений, которое показывает потенциал локализовать злокачественную опухоль автоматически с небольшим вмешательством со стороны специалистов-специалистов. В частности, в опубликованном исследовании автоматизированная сегментация была оценена для целей оценки IHC для ключевого ядерного пятна ER. Сообщалось о интенсивности, пропорции и суммарной (т. Е. Сумме интенсивности и пропорции) показателей IHC, включая изменчивость между пациентами с патологиями с существенным опытом обеспечения качества.

В литературе по компьютерному видению оценка автоматизированных алгоритмов сегментации опухолей обычно выполняется поэтапно. Наш алгоритм анализа изображений привел к сильным соглашениям на уровне пикселей, усредняющим κ = 0,811 с ​​двумя экспертами-патологоанатомами, которые были лишь немного ниже соглашения с патологом (κ = 0,908). Однако определение влияния разногласий на уровне пикселей в клинической практике является сложной задачей. Поэтому в этом исследовании был представлен метод категоризации разногласий, поскольку предполагаемое использование приложения — это оценка IHC. Соотношение разногласий (табл. 2) выявило более 27% разногласий между автоматическими и ручными сегментами, что соответствует незначительной несогласованности границ опухоли (тип 1) и поэтому несущественно для оценки IHC, поскольку эпителиальная клетка не может вписаться в эти области. Остальные разногласия (тип 2 и 3) значительно различались между пятнами TMA, как показано высокими s.d. и в соответствии с диапазоном морфологии стромы опухоли и пери-тумора, наблюдаемой при раке молочной железы.

При анализе показателей интенсивности, полученных из ручных и автоматизированных сегментов, было достигнуто сильное согласие (таблица 3) с небольшой разницей при обучении по подсчету патологоанатомом A (0,92) по сравнению с патологоанатом B (0,87), предполагающим, что автоматизированный подход не сильно зависит от индивидуального патологоанатома , Напротив, соглашения о пропорциональных показателях с использованием автоматизированных масок сегментации были ниже, чем сообщалось (inter-rater = 0,97) с недооценкой в ​​TMA, где были высокие доли положительных клеток (рисунок 4).

В настоящем исследовании оценки IHC для ER были представлены для двух широко используемых систем оценки, Allred и Quickscore. Оценки IHC, рассчитанные на основе автоматизированных сегментов, находились в сильном согласии с оценками из полученных вручную сегментов (таблица 4). Хотя сообщаемые значения не так высоки, как соглашение между ратерами, оценки Allred от автоматизированных сегментов отличались не более чем на одну точку. С дальнейшими инструкциями и примерами обучения автоматизация может быть улучшена дополнительно, с возможностью замены ручных аннотаций, тем самым увеличивая рабочий процесс. Кроме того, показатели ER, рассчитанные на основе автоматизированных сегментов, были более последовательными, чем оценки, полученные из ручных сегментов. В наших экспериментах Quickscores были идентичны для автоматизированной сегментации во всех 32 точках TMA, независимо от того, на кого была обучена система; Аналогично, результаты Allred были близки, и любые различия вряд ли привели бы к лечению, даже если они использовались в клинических условиях. Используя более сложный ядерный биомаркер, положительные клетки Ki67 (Mohammed et al, 2012) показали, что автоматизация может обеспечивать стандартизированные меры, тем самым уменьшая изменчивость между и внутри наблюдателя. Кроме того, алгоритм анализа изображения, используемый в этом исследовании, также применим к другим клиническим измерениям, таким как Histoscore (Jonat et al, 1986).

Дихотомия опухоли в ER + ve и ER-ve необходима для принятия решений о лечении эндокринной терапии в клинической практике. В настоящем исследовании отметка обрезания Allred (> 2), эквивалентная обрезанию USCAP 1%, привела к почти полному соглашению между всеми зарегистрированными сегментами. Используя Quickscores (cut-off> 3), два пятна TMA были помечены как ER + ve из автоматизированных сегментов и тех же мест, обозначенных ER-ve, из полученных вручную сегментов. Остальные 30 точек, 20 ER + ve и 10 ER-ve, находились в полном согласии по всем сегментам. Как правило, в решениях о лечении было достигнуто общее согласие, однако результаты варьировались между системами подсчета очков и нестандартизированными срезами. Эти расхождения предполагают, что потребуется дополнительная работа, прежде чем автоматизация будет применена для принятия решений о лечении, как предлагается для исследований, сравнивающих визуальную и автоматическую оценку маркеров Ki67 при раке молочной железы (Fasanella et al, 2011; Mohammed et al, 2012). Однако такие количественные и пропорционально небольшие расхождения могут быть незначительными при установлении клинических испытаний с сотнями, а в некоторых случаях и с тысячами пациентов-участниц. Учитывая потребность в анализах ТМА, настоящий анализ ER должен быть применим к окрашиванию прогестерона (PR) или окрашиванию Ki67, оба из которых также являются интенсивными ядерными пятнами. Тем не менее, дополнительные проблемы, такие как гетерогенность экспрессии белка ПР, также наблюдаются с маркерами, которые обычно не используются в клинической практике, такие как р53 (Coates et al, 2012). Для Ki67 остается много соображений, связанных с используемым антителом, методами оценки и срезами для положительного v отрицательного (Yerushalmi et al, 2010; Dowsett et al, 2011).

Несмотря на несогласие на уровне пикселей, составляющие в среднем 16% (таблица 1), рассчитанные оценки IHC от автоматизированной сегментации находились в сильном согласии с оценками, вычисленными из ручных сегментов (Allred = 0.91, Quickscore; = 0.92). При большем числе образцов опухолей вполне вероятно, что применение этого метода автоматической аннотации приведет к аналогичным результатам к более трудоемким ручным аннотациям. Таким образом, преимущества автоматизации выходят за рамки воспроизводимости оценок IHC, включая изменение фокуса рабочих нагрузок исследовательских патологов и воспроизводимость показателей IHC. В принципе, описанный здесь обобщаемый автоматизированный метод для сегментации опухолей должен быть расширен до окрашивания цитоплазматической или опухолевой клеточной мембраны (например, HER2) и будет исследован в будущей работе.

Метод автоматической сегментации иногда затруднял выделение раковых клеток ER-ve из ER-ve здоровых эпителиальных клеток. Таким образом, наличие большего количества пятен ТМА, содержащих как раковые клетки ER-ve, так и здоровые эпителиальные клетки ER-ve, а также точные аннотации этих мест для тренировки, вероятно, будет иметь существенную пользу. Действительно, увеличение объема аннотированных пятен для обучения более полно представляет собой ряд условий окрашивания, тканевых структур и артефактов, которые могут улучшить точность сегментации и далее выровнять автоматические анализы с результатами специализированных патологоанатомов. Влияние использования больших объемов аннотаций во время обучения может быть полезно изучено в будущей работе.

Таким образом, использование автоматических аннотаций для оценки TMA грудной клетки с использованием методов, разработанных и приведенных в качестве примеров в этом исследовании, тесно связано с экспертными обзорами патологии. 27% разногласий в пикселях связаны с незначительным несогласованностью границ вытянутой опухоли. Классификационные различия редко приводили к изменению общей оценки, которая, вероятно, изменила бы клиническое управление. Используя образец ядерного окрашивания ER, применяемые здесь методы автоматизированной аннотации обещают сократить требуемое время патологической патологии и ускорить анализ TMA, окрашенных IHC, из больших наборов данных, полученных из клинических испытаний.

Эта работа финансировалась Британским советом по исследованиям в области инженерных и физических наук (грант EP / J500392 / 1) и Университетом Данди. Авторы благодарят Фила Куинлана (Advanced Data Analysis Center, Университет Ноттингема) за его экспертную техническую помощь. Мы также благодарны за вклад в это исследование, сделанное Tayside Tissue Bank, финансируемое Кампанией рака молочной железы, Cancer Research UK и Главным научным управлением.

Дополнительная информация сопровождает эту статью на веб-сайте British Journal of Cancer (http://www.nature.com/bjc)

Авторы объявили, что нет никаких конфликтов интересов.

Щелкните здесь для получения дополнительных данных.

Щелкните здесь для получения дополнительных данных.

Примеры разногласий типа 1 (красный), типа 2 (зеленый) и типа 3 (синий). Аннотации, сделанные патологоанатом A (фиолетовый) и патологоанатом B (оранжевый), показаны на правой стороне сверху на исходном изображении.

Точка TMA (слева) и цветные изображения, показывающие типы разногласий между рукописными аннотациями двух патологов (верхняя строка), патологоанатом A и алгоритмом, подготовленным этим патологоанатом (средний ряд) и патологом B, и алгоритмом, обученным этому патологоанатом (нижний ряд).

Круговые диаграммы, показывающие распределение соглашений, а также разногласия типа 1, типа 2 и типа 3 между ручной и автоматизированной сегментацией.

Блэнд-Альтман-график процента положительных клеток, идентифицированных в программном обеспечении Aperio. Точки TMA показаны черными точками (патологоанатом A) и синими бриллиантами (патологоанатом B).

Гистограммы графиков Allred и Quickscores, извлеченных из ручных и автоматизированных сегментов.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *