Contexto que Conecta: ciência por trás do nosso scouting de Parceiros Tecnológicos para Empresas Transformadoras

Contexto que Conecta: ciência por trás do nosso scouting de Parceiros Tecnológicos para Empresas Transformadoras

Desde 2021, a MatchIT mantém um convênio de P&D com o recod.ai — laboratório de Recuperação de Informação do Instituto de Computação / Unicamp — coordenado pelo Prof. Anderson Rocha.  

Nosso projeto é liderado pelo professor Marcelo Reis, e busca refinar continuamente o algoritmo que recomenda Parceiros Tecnológicos (empresas que oferecem soluções de tecnologia e inovação) às Empresas Transformadoras (organizações que buscam acelerar sua jornada de inovação). 

Três pilares do algoritmo 

 

  1. Representação semântica avançada: Ajustamos modelos BERT em um corpus específico de inovação para gerar vetores densos que capturam stack, setor atendido e estágio de maturidade de cada solução.
  2. Rankeamento supervisionado (“learning-to-rank”): Combinamos similaridade textual, ontologias proprietárias e histórico de sucesso para ordenar os candidatos conforme probabilidade de conversão.
  3. Explicabilidade & governança: Armazenamos as features que mais influenciam cada recomendação — e, a cada sprint, auditamos possíveis enviesamentos. 

 

A pergunta de pesquisa 

Se ampliarmos o contexto textual (blogs, cases, pitches) nos perfis dos Parceiros Tecnológicos, o algoritmo melhora a taxa de match sem prejudicar a relevância para as Empresas Transformadoras? 

 

Quem investigou foi Bruno Renzo, mestrando em Ciência da Computação orientado pelo Prof. Reis dentro do convênio MatchIT ↔ recod.ai. 

 

Desenho experimental de Renzo 

 

Etapa  Descrição 
Objetivo  Analisar o impacto que a ampliação de contexto dos Parceiros Tecnológicos traz para a performance do sistema de match 
Amostras  Parceiros que aderiram ao antigo Plano Premium, habilitando conteúdos ricos em seus perfis. 
Teste pareado  Comparação da performance do sistema antes e depois de ampliar o contexto dos parceiros com o Plano Premium 
Métricas  Duas métricas foram analisadas: (i) Market share dos Parceiros Tecnológicos, e (ii) Precisão das recomendações que as Empresas Transformadoras recebem. 

 

Principais descobertas

 

  • Ganho absoluto de +1,6 p.p. no market share dos Parceiros Premium . 
  • Incremento relativo de 45 % sobre a participação prévia de cada parceiro . 
  • Correlação direta: quanto maior o volume de conteúdo rico publicado, maior o ganho . 
  • Precisão inalterada — nenhuma perda estatística P@10* para as Empresas Transformadoras . 

 

“Fica evidente o ganho de performance para os Parceiros Tecnológicos. O interessante é que isso ocorre de maneira orgânica: o sistema amplia a visibilidade dos parceiros e, ainda assim, mantém a qualidade das recomendações para quem contrata”, conclui Renzo .

 

 

* P@10 (Precision at 10) é a porcentagem de resultados realmente relevantes entre os 10 primeiros itens recomendados; ou seja, se o algoritmo mostrar 10 parceiros e 7 deles forem considerados adequados pela Empresa Transformadora, o P@10 será 0,70. 

Por que mais contexto ajuda? 

 

Um ponto central do nosso sistema de recomendação é a busca por vetores. Nessa abordagem, transformamos a representação textual de Parceiros Tecnológicos e Empresas Transformadoras em vetores de números reais. A vantagem dessa representação numérica é que podemos, então, utilizar operações aritméticas para mensurar a similaridade entre essas entidades. 

Por exemplo, podemos transformar um parceiro p e uma empresa e em vetores (v_p , v_e ) e, através do ângulo formado por esses dois vetores, medir sua similaridade (similaridade de cosseno): 

score(v_p , v_e) = cos_sim(v_p , v_e) 

Um ponto essencial nessa abordagem é a qualidade dos vetores gerados. Dois fatores são os principais determinantes:
(i) o modelo utilizado para gerar os vetores;
(ii) os dados textuais utilizados na representação inicial. 

Com relação ao primeiro fator, utilizamos os melhores modelos disponíveis para geração de vetores. Esses modelos foram treinados com quantidades massivas de dados e apresentam os desempenhos superiores nos estudos comparativos realizados. 

Com relação ao segundo fator, temos o nosso Plano Premium. Por meio da ampliação de contexto, conseguimos embasar a criação dos vetores em dados textuais mais ricos — o que leva a uma melhor representação e mais matches! 

 

Próximo passo: planos focados em dados estruturados e badges 

 

 Os achados de Renzo consolidaram o primeiro componente do nosso Plano Premium para empresas fornecedoras. Agora, nós consideramos outros aspectos que também podem ser explorados na evolução desse modelo de entrega de valor para nosso ecossistema. 

score(v_p , v_e) = α · cos(v_p , v_e) + β · features_struct + γ · badge_score 

Pilar  Impacto no algoritmo  Valor tangível 
Metadados padronizados  Alimentam features_struct com consistência.  Mais matches qualificados, descobertos com rapidez. 
Badges de certificação  Atuam como boostersγ, reforçando confiança.  Menos atrito na etapa de shortlist. 
Conteúdo guiado por IA  Assistente sugere termos de alto ganho de sinal.  Menor esforço editorial, maior ROI de visibilidade. 

 

Impacto para o ecossistema de inovação 

 

  • Para os Parceiros Tecnológicos—— destaque orgânico baseado em evidência técnica, não em marketing puro. 
  • Para as Empresas Transformadoras—— recomendações completas, transparentes e alinhadas à sua estratégia digital. 
  • Para a MatchIT —— um motor de scouting que evolui com metodologia científica e parceria acadêmica. 

 

Ao demonstrar que contexto qualificado gera convergência entre oferta e demanda sem sacrificar precisão, o estudo de Bruno Renzo comprova a vocação da MatchIT: transformar dados em conexões de inovação que realmente acontecem. 

Em complemento, esse estudo reforça o jeito de ser da MatchIT: valorizamos a conexão do conhecimento acadêmico à prática e valor de mercado, o que é vivenciado por nossas parcerias em P&D com Centros de Pesquisa, como essa sólida conexão com o Instituto de Computação da Unicamp.